Có một lý do để thích một biện pháp đa hình cụ thể?


22

Khi làm việc với nhiều biến đầu vào, chúng ta thường quan tâm đến tính đa hình . Có một số biện pháp về đa cộng đồng được sử dụng để phát hiện, suy nghĩ và / hoặc truyền đạt tính đa hình. Một số khuyến nghị phổ biến là:

  1. Nhiều cho một biến cụ thể Rj2
  2. Dung sai, , cho một biến cụ thể 1-Rj2
  3. Hệ số lạm phát phương sai, , cho một biến cụ thể VIF= =1lòng khoan dung
  4. Số điều kiện của toàn bộ ma trận thiết kế:

    tối đa (giá trị riêng (X'X))tối thiểu (giá trị riêng (X'X))

(Có một số tùy chọn khác được thảo luận trong bài viết Wikipedia và ở đây về SO trong bối cảnh của R.)

Việc ba người đầu tiên là một chức năng hoàn hảo của nhau cho thấy lợi thế ròng duy nhất có thể có giữa họ sẽ là tâm lý. Mặt khác, ba phương thức đầu tiên cho phép bạn kiểm tra các biến riêng lẻ, đây có thể là một lợi thế, nhưng tôi đã nghe nói rằng phương pháp số điều kiện được coi là tốt nhất.

  • Điều này có đúng không? Tốt nhất để làm gì?
  • Số điều kiện có phải là một hàm hoàn hảo của không? (Tôi sẽ nghĩ rằng nó sẽ được.) Rj2
  • Mọi người có thấy rằng một trong số họ là dễ giải thích nhất không? (Tôi chưa bao giờ cố gắng giải thích những con số này bên ngoài lớp học. Tôi chỉ đưa ra một mô tả chất lượng, lỏng lẻo về tính đa hình.)

Tôi đã đăng một câu hỏi tiếp theo có liên quan, với câu trả lời cho việc bổ sung những gì đã có ở đây: stats.stackexchange.com/questions/173665/ Lỗi
kyrenia

Câu trả lời:


15

Trở lại vào cuối những năm 1990, tôi đã làm luận án về sự cộng tác.

Kết luận của tôi là chỉ số điều kiện là tốt nhất.

Lý do chính là, thay vì nhìn vào các biến riêng lẻ , nó cho phép bạn xem các bộ biến. Vì collinearity là một hàm của các bộ biến, nên đây là một điều tốt.

Ngoài ra, kết quả nghiên cứu Monte Carlo của tôi cho thấy độ nhạy tốt hơn đối với cộng tác có vấn đề, nhưng từ lâu tôi đã quên các chi tiết.

Mặt khác, nó có lẽ là khó giải thích nhất. Rất nhiều người biết là gì. Chỉ có một tập hợp nhỏ của những người đã nghe về giá trị bản địa. Tuy nhiên, khi tôi đã sử dụng các chỉ mục điều kiện như một công cụ chẩn đoán, tôi chưa bao giờ được yêu cầu giải thích.R2

Để biết thêm về điều này, hãy xem sách của David Belsley. Hoặc, nếu bạn thực sự muốn, bạn có thể nhận được luận án chẩn đoán đa điểm của tôi cho hồi quy bội: Một nghiên cứu ở Monte Carlo


1
Vì vậy, ý tưởng ở đây là nhìn vào VIF, bạn có thể kết luận nhầm rằng tính đa hình không phải là vấn đề, nhưng nếu bạn đã xem số điều kiện, bạn có nhiều khả năng đưa ra kết luận đúng? Có lẽ một cái gì đó giống như một bài kiểm tra w / sức mạnh thống kê lớn hơn?
gung - Phục hồi Monica

4
+1. May mắn thay, để giải thích số điều kiện, chúng tôi đã có một luồng nổi bật trên trang web này: đó là biến dạng tối đa được tìm thấy trong mô tả bậc hai của các biến thiết kế dưới dạng đám mây điểm. Độ méo càng lớn, các điểm có xu hướng nằm trong một không gian con càng nhiều. Cái nhìn sâu sắc hình học này cũng cho thấy tại sao điều hòa của ma trận thiết kế tập trung tốt hơn so với ma trận thiết kế thô.
whuber

1
Chà, thật khó để định nghĩa chính xác kết luận "đúng" là gì; nhưng nó nên có một cái gì đó để làm với những thay đổi nhỏ trong dữ liệu tạo ra những thay đổi lớn trong đầu ra. Khi tôi nhớ lại, các chỉ số điều kiện có liên quan trực tiếp hơn đến điều này. Nhưng điều quan trọng là có được tỷ lệ phương sai, cho phép bạn thấy các bộ biến và mức độ cộng tác của chúng. (Tất nhiên, tất cả những gì đã xảy ra cách đây 14 năm .... nhưng tôi không nghĩ mọi thứ đã thay đổi. Các biện pháp là như nhau. Nhưng trí nhớ của tôi có thể không hoàn hảo).
Peter Flom - Tái lập Monica

3
Gung, một điểm quan trọng ở đây là số điều kiện không phụ thuộc vào tọa độ: nó vẫn không thay đổi theo sự tái hợp tuyến tính (trực giao) của dữ liệu. Do đó, nó không thể biểu thị bất cứ điều gì về các biến riêng lẻ nhưng nó phải chiếm được một thuộc tính của toàn bộ bộ sưu tập. Sử dụng nó do đó một phần giúp bạn không bị nhầm lẫn bởi cách các biến của bạn được thể hiện.
whuber

1
Tôi đã quá lúng túng để hoàn thành luận văn của bạn, nhưng nó thực sự hữu ích cho đến nay. Cảm ơn một lần nữa.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.