Để mở rộng một chút về câu trả lời của @ ken-butler. Bằng cách thêm cả biến liên tục (giờ) và biến chỉ báo cho một giá trị đặc biệt (giờ = 0 hoặc không cho con bú), bạn nghĩ rằng có một hiệu ứng tuyến tính cho giá trị "không đặc biệt" và một bước nhảy rời rạc trong kết quả dự đoán ở giá trị đặc biệt. Nó giúp (ít nhất là cho tôi) nhìn vào biểu đồ. Trong ví dụ dưới đây, chúng tôi mô hình tiền lương hàng giờ như một chức năng của giờ mỗi tuần mà người trả lời (tất cả phụ nữ) làm việc và chúng tôi nghĩ rằng có một cái gì đó đặc biệt về "tiêu chuẩn" 40 giờ mỗi tuần:
Mã tạo ra biểu đồ này (trong Stata) có thể được tìm thấy ở đây: http://www.stata.com/stirthist/archive/2013-03/msg00088.html
Vì vậy, trong trường hợp này, chúng tôi đã gán cho biến liên tục một giá trị 40 mặc dù chúng tôi muốn nó được xử lý khác với các giá trị khác. Tương tự như vậy, bạn sẽ cho tuần của bạn cho con bú giá trị 0 mặc dù bạn nghĩ rằng nó khác biệt về chất với các giá trị khác. Tôi giải thích bình luận của bạn dưới đây mà bạn nghĩ rằng đây là một vấn đề. Đây không phải là trường hợp và bạn không cần thêm một thuật ngữ tương tác. Trên thực tế, thuật ngữ tương tác đó sẽ bị loại bỏ do sự cộng tác hoàn hảo nếu bạn đã thử. Đây không phải là một giới hạn, nó chỉ cho bạn biết rằng các điều khoản tương tác không thêm bất kỳ thông tin mới nào.
Nói phương trình hồi quy của bạn trông như thế này:
y^=β1weeks_breastfeeding+β2non_breastfeeding+⋯
Trong đó là số tuần cho con bú (bao gồm giá trị 0 cho những người không cho con bú) và n o n _ b r e a s t f e e d i n g là một biến chỉ số là 1 khi ai đó không cho con bú và 0 khác.weeks_breastfeedingnon_breastfeeding
Hãy xem xét những gì xảy ra khi ai đó đang cho con bú. Phương trình hồi quy đơn giản hóa thành:
y^=β1weeks_breastfeeding+β20+⋯=β1weeks_breastfeeding+⋯
Vì vậy, chỉ là một hiệu ứng tuyến tính của số tuần cho con bú cho những người làm con bú.β1
Hãy xem xét những gì đang xảy ra khi ai đó không cho con bú:
y^=β10+β21+⋯=β2+⋯
Vì vậy, cho bạn hiệu quả của việc không cho con bú và số tuần cho con bú giảm từ phương trình.β2
Bạn có thể thấy rằng không có cách nào để thêm một thuật ngữ tương tác, vì thuật ngữ tương tác đó đã có (ngầm) trong đó.
Tuy nhiên, có một điều kỳ lạ về , vì nó đo lường hiệu quả của việc cho con bú bằng cách so sánh kết quả mong đợi của những người không cho con bú với những người cho con bú nhưng chỉ làm như vậy trong 0 tuần ... giống như kiểu "cách, nhưng tính hữu dụng thực tế không phải là rõ ràng. Có thể có ý nghĩa hơn khi so sánh "những người không cho con bú" với những phụ nữ đang cho con bú 12 tuần (khoảng 3 tháng). Trong trường hợp đó, bạn chỉ cần cung cấp cho "người không cho con bú" giá trị 12 cho w e e k s _ b r e a s t f e e d i n gβ2weeks_breastfeeding. Vì vậy, giá trị bạn gán cho cho "những người không cho con bú" không ảnh hưởng đến hệ số hồi quy β 2 theo nghĩa là nó xác định với ai là "không -bTHERfeeders "được so sánh. Thay vì một vấn đề, đây thực sự là một cái gì đó có thể khá hữu ích.weeks_breastfeedingβ2