Tại sao bao gồm thuật ngữ tương tác trong mô hình hồi quy logistic giúp đánh giá giả định tuyến tính?


10

Trong Discovering kê sử dụng SPSS 4th Edition bởi Andy Field, đó là khuyến cáo để bao gồm các thuật ngữ tương tác giữa các biến độc lập và logarit tự nhiên chuyển đổi tương ứng của nó biến để kiểm tra các vi phạm giả thiết tuyến tính. Lý thuyết thống kê đằng sau này là gì?xln(x)

Đây là một trích dẫn từ cuốn sách:

Giả định này có thể được kiểm tra bằng cách xem xét liệu thuật ngữ tương tác giữa yếu tố dự đoán và chuyển đổi nhật ký của nó có đáng kể hay không (Hosmer & Lemeshow, 1989).

Gần đây tôi cũng phát hiện ra rằng phép biến đổi này được gọi là phép biến đổi Box-Tidwell.


2
Tôi nhớ lại rằng cuốn sách đưa ra lời khuyên đáng ngờ từ một câu hỏi khác ở đây: stats.stackexchange.com/questions/157217/. Điều này bao gồm x ln (x) cũng đánh tôi là cũng đáng ngờ.
Matthew Drury

4
Có thể có một lý do tốt cho nó, nhưng bối cảnh có thể sẽ giúp xác định vị trí của nó nhanh hơn. Trường đã sử dụng cơ sở nào để đề xuất nó là một ý tưởng tốt? Ông có cung cấp bất kỳ tài liệu tham khảo? Bạn có thể trích dẫn những gì cuốn sách nói?
Glen_b -Reinstate Monica

1
Một cách tốt hơn (được cung cấp đủ dữ liệu) có thể là sử dụng GAM logistic (mô hình phụ gia tổng quát) và bao gồm một khớp nối spline của x.
kjetil b halvorsen

@Glen_b Tôi đã thêm một trích dẫn từ cuốn sách của Andy Field
chiếu vào

Mới đối với tôi, nhưng dường như có ý nghĩa đối với một loại phi tuyến tính cụ thể: stats.uwo.ca/facemony/braun/ss3859/notes/Ch CHƯƠNG6 / ch5notes.pdf
Scortchi - Tái lập Monica

Câu trả lời:


18

Box và Tidwell (1962) [1] đã trình bày một cách tiếp cận chung chung để ước tính các phép biến đổi của các yếu tố dự báo riêng lẻ (IV) và làm việc thông qua trường hợp cụ thể về ước tính biến đổi công suất của các biến dự báo (bao gồm cả công suất 0, với tỷ lệ phù hợp - tương ứng với việc lấy nhật ký làm trường hợp giới hạn).

Trong trường hợp cụ thể của biến đổi năng lượng, hóa ra có một kết nối để hồi quy trên .Xjlog(Xj)

Vì vậy, nếu bạn có tính phi tuyến tính trong đó mối quan hệ thực sự (có điều kiện) giữa và là tuyến tính trong thì nó có thể được sử dụng để kiểm tra hoặc thực sự để ước tính giá trị .YXjXjαjαj1α

Cụ thể, khi hồi quy trên và , hệ số của số hạng thứ hai chia cho số thứ nhất là ước tính gần đúng của . (Ước tính này có thể được lặp lại để hội tụ.)XjXjlog(Xj)αj1

Nếu ước tính gần bằng 1 thì có rất ít dấu hiệu cần phải chuyển đổi.αj

Lưu ý rằng vì hai thuật ngữ trong sản phẩm đều là các chức năng của , đây chỉ đơn giản là một chuyển đổi nên tôi sẽ không gọi đó là tương tác; nó chỉ là một công cụ dự đoán biến đổi. (Thật vậy, ngay cả khi tôi bị cám dỗ bằng cách nào đó, vì không được đưa vào như một công cụ dự đoán, tôi vẫn không có xu hướng mô tả thuật ngữ thứ hai đó như một tương tác.)Xjlog(Xj)XjXjlog(Xj)

[1]: Box, GEP và Tidwell, PW (1962), "Chuyển đổi các biến độc lập." Technometrics 4 , 531-550.


1
Có lẽ điều này có một số giá trị hạn chế, đặc biệt là nếu người ta có lý do để mong đợi tính phi tuyến của dạng sức mạnh cụ thể đó hoặc nếu người ta buộc phải sử dụng phần mềm không cung cấp các lựa chọn thay thế hiện đại hơn, như sử dụng GAM (mô hình phụ gia tổng quát), ước tính hiệu quả sự phi tuyến trực tiếp với splines. Hoặc, nếu số lượng quan sát của chúng tôi ở mức thấp để cho phép sử dụng spline.
kjetil b halvorsen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.