Đây không phải là vấn đề cụ thể đối với R. R sử dụng hiển thị các hệ số thông thường.
Khi bạn đọc đầu ra hồi quy như vậy (trong một bài báo, sách giáo khoa hoặc từ phần mềm thống kê), bạn cần biết biến nào là "liên tục" và "biến" là gì:
Các giá trị "liên tục" là số rõ ràng và các giá trị số của chúng được sử dụng như trong phần khớp hồi quy.
Các biến "phân loại" có thể thuộc bất kỳ loại nào , bao gồm cả các biến số! Điều làm cho chúng phân loại là phần mềm coi chúng là "các yếu tố": nghĩa là, mỗi giá trị riêng biệt được tìm thấy được coi là một chỉ số của một cái gì đó khác biệt.
Hầu hết các phần mềm sẽ coi các giá trị không phải là số (như chuỗi) là các yếu tố. Hầu hết các phần mềm có thể được thuyết phục để coi các giá trị số là các yếu tố. Ví dụ: mã dịch vụ bưu chính (mã ZIP ở Mỹ) trông giống như một số nhưng thực sự chỉ là mã cho một bộ hộp thư; sẽ không có ý nghĩa gì khi cộng, trừ và nhân mã ZIP với các số khác! (Tính linh hoạt này là nguồn gốc của một lỗi phổ biến: nếu bạn không cẩn thận hoặc không muốn, phần mềm của bạn có thể coi một biến bạn coi là phân loại là liên tục hoặc ngược lại. Hãy cẩn thận!)
Tuy nhiên, các biến phân loại phải được biểu diễn theo một cách nào đó dưới dạng số để áp dụng các thuật toán phù hợp. Có nhiều cách để mã hóa chúng. Các mã được tạo bằng cách sử dụng "biến giả". Tìm hiểu thêm về mã hóa biến giả bằng cách tìm kiếm trên trang web này; các chi tiết không quan trọng ở đây.
Trong câu hỏi, chúng tôi được cho biết rằng h
và f
là các giá trị phân loại ("rời rạc"). Theo mặc định, log(d)
và a
là liên tục. Đó là tất cả những gì chúng ta cần biết. Mô hình là
y= - 0,679695+ 1.791294 nhật ký ( d)+ 0.870735- 0.448570+ 0,542033+ 0,037362 một - 0,588362+ 0,866825+ 0,534440- 0,085658 một - 0,034970 một - 0,040637 một nếu h = h1 nếu h = h2 nếu h = h3 nếu f= f1 nếu f= f2 nếu f= f3 nếu h = h1 nếu h = h2 nếu h = h3
Các quy tắc được áp dụng ở đây là:
Thuật ngữ "chặn", nếu nó xuất hiện, là hằng số phụ gia (dòng đầu tiên).
Các biến liên tục được nhân với hệ số của họ, ngay cả trong "tương tác" giống như h1:a
, h2:a
và h3:a
các điều khoản. (Điều này trả lời câu hỏi ban đầu.)
Bất kỳ biến phân loại (hoặc yếu tố) được bao gồm chỉ đối với trường hợp giá trị của yếu tố xuất hiện.
Ví dụ: giả sử , , và . Giá trị được trang bị trong mô hình này làđăng nhập( d) = 2h = h3a = - 1f= f2
y^= - 0,6797 + 1,7913 × ( 2 ) + 0,5420 + 0,0374 × ( - 1 ) + 0,8668 - 0,0406 × ( - 1 ) .
Thông báo như thế nào hầu hết các hệ số mô hình đơn giản là không xuất hiện trong tính toán, bởi vì h
có thể đảm nhận chính xác một trong ba giá trị , , và do đó chỉ có một trong ba hệ số áp dụng cho và chỉ một trong ba hệ số sẽ nhân lên trong tương tác; tương tự, chỉ có một hệ số áp dụng cho bất kỳ trường hợp cụ thể nào.h 2 h 3 ( 0.870735 , - 0.447570 , 0.542033 ) ( - 0,085658 , - 0,034970 , - 0,040637 )h1h2h3( 0.870735 , - 0.447570 , 0.542033 )h
( - 0,085658 , - 0,034970 , - 0,040637 )a
h:a
f
g1