Có bao giờ một lý do để không sử dụng đa thức trực giao khi hồi quy phù hợp?


13

Nói chung, tôi tự hỏi liệu có tốt hơn không khi sử dụng đa thức trực giao khi điều chỉnh hồi quy với các biến bậc cao hơn. Đặc biệt, tôi đang tự hỏi với việc sử dụng R:

Nếu poly()với raw = FALSEsản xuất các giá trị được trang bị tương tự như poly()với raw = TRUE, và polyvới raw = FALSEgiải quyết một số vấn đề liên quan với hồi quy đa thức, sau đó nên poly()raw = FALSE luôn luôn được sử dụng cho phù hợp hồi quy đa thức? Trong trường hợp nào tốt hơn là không sử dụng poly()?

Câu trả lời:


16

Bao giờ một lý do? Chắc chắn rồi; nhiều khả năng

Ví dụ, hãy xem xét nơi tôi quan tâm đến các giá trị của các hệ số thô (nói để so sánh chúng với các giá trị giả định) và cộng tuyến không phải là một vấn đề cụ thể. Đó là khá nhiều lý do tương tự tại sao tôi thường không có nghĩa là trung tâm trong hồi quy tuyến tính thông thường (đó là đa thức trực giao tuyến tính)

Chúng không phải là những thứ bạn không thể giải quyết thông qua đa thức trực giao; đó là vấn đề thuận tiện hơn, nhưng sự tiện lợi là lý do lớn khiến tôi làm nhiều việc.

Điều đó nói rằng, tôi nghiêng về đa thức trực giao trong nhiều trường hợp trong khi phù hợp với đa thức, vì chúng có một số lợi ích khác biệt.


có thể so sánh các hệ số dẫn đến từ hồi quy đa thức trực giao với các giá trị giả thuyết không?
user2374133

2
Đúng. Bạn có thể chuyển đổi chúng trở lại các hệ số ngụ ý và các lỗi tiêu chuẩn từ các đa thức "thô" chẳng hạn.
Glen_b -Reinstate Monica

2
Thường xuyên hơn không, chuyển đổi từ cơ sở đa thức trực giao sang cơ sở đơn thức là một quá trình không có điều kiện (đối với mức độ cao; chuyển đổi mức độ thấp không quá tệ), vì vậy, nếu một người là một người tiên phong quan tâm đến các hệ số cơ bản, bất kỳ sự ổn định về số mà bạn có được từ việc sử dụng các đa thức trực giao được đưa ra ngoài cửa sổ khi chuyển đổi, do đó bạn cũng có thể sử dụng các đơn thức ngay từ đầu. Trống rỗng , tất nhiên.
JM không phải là một thống kê

1
@JM Cảm ơn, đó là một điểm tuyệt vời. May mắn là ngày nay rất hiếm trong các ứng dụng thống kê để phù hợp hơn một đa thức bậc thấp (lời khuyên thông thường của tôi là trừ khi có lý do mạnh về lý thuyết để vượt lên cấp ba hoặc bốn, người ta nên xem xét các cách tiếp cận khác nhau - phương pháp thay thế có thể là tốt nhất tùy thuộc vào hoàn cảnh, nhưng những thứ như splines chẳng hạn, có thể phù hợp với một số tình huống.).
Glen_b -Reinstate Monica

13

Bởi vì nếu mô hình của bạn rời khỏi R khi nó lớn lên, bạn phải nhớ đóng gói các hằng số định tâm & chuẩn hóa của nó, và sau đó nó phải kéo chúng đi khắp nơi. Hãy tưởng tượng một ngày nào đó nó được mã hóa thành SQL, và nỗi kinh hoàng khi nhận ra nó đã đánh lừa họ!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.