hồi quy bội và so sánh nhiều


10

Nói rằng tôi phù hợp với một hồi quy bội của các biến giải thích p. Kiểm tra t sẽ cho phép tôi kiểm tra xem có bất kỳ một trong số đó có ý nghĩa hay không ( ). Tôi có thể thực hiện kiểm tra F một phần để kiểm tra xem một số tập hợp con của chúng có ý nghĩa hay không ( ).H0:βi=0H0:βi=βj=...=βk=0

Tuy nhiên, điều mà tôi thường thấy là ai đó nhận được 5 giá trị p từ 5 lần kiểm tra (giả sử họ có 5 đồng biến) và chỉ giữ những giá trị p <0,05. Điều đó có vẻ hơi không chính xác vì thực sự nên có một kiểm tra so sánh nhiều không? Có thực sự công bằng khi nói một cái gì đó như và là đáng kể nhưng , và thì không?β1β2β3β4β5

Trên một lưu ý liên quan, giả sử tôi chạy 2 hồi quy trên 2 mô hình riêng biệt (kết quả khác nhau). Có cần phải có một kiểm tra so sánh nhiều cho các tham số quan trọng giữa hai kết quả không?

Chỉnh sửa: Để phân biệt với câu hỏi tương tự, có cách giải thích nào khác cho các giá trị p bên cạnh: "B_i có ý nghĩa, khi điều chỉnh cho tất cả các hiệp phương sai khác" không? Dường như cách giải thích này cho phép tôi xem xét mọi B_i và bỏ những điểm nhỏ hơn 0,5 (tương tự như bài đăng khác).

Dường như với tôi, một cách chắc chắn để kiểm tra xem B_i và Y có mối quan hệ nào không là lấy giá trị p của hệ số tương quan cho mỗi hiệp phương sai và sau đó thực hiện đa biến (mặc dù điều đó chắc chắn sẽ mất tín hiệu).

Cuối cùng, giả sử tôi đã tính toán mối tương quan giữa B1 / Y1, B2 / Y1 và B3 / Y1 (do đó có ba giá trị p). Không liên quan, tôi cũng đã làm một mối tương quan giữa T1 / Y2, T2 / Y2, T3 / Y2. Tôi giả sử điều chỉnh Bonferroni chính xác sẽ là 6 cho tất cả 6 thử nghiệm cùng nhau (thay vì 3 cho nhóm thứ nhất và 3 cho nhóm thứ hai - và do đó nhận được 2 giá trị p "bán" được điều chỉnh).


1
Điều này trông giống như một bản sao của (câu hỏi này) [ stats.stackexchange.com/questions/3200/ Khăn nếu nó không vui lòng nói tại sao không.
Peter Flom - Tái lập Monica

Xin chào, nó tương tự nhưng không hoàn toàn giống nhau. Có lẽ một câu hỏi tốt hơn là, khi người ta nhận được danh sách các giá trị p, là cách giải thích duy nhất có thể có sau đây: "Kiểm soát tất cả các tham số khác, biến này nằm trong / đáng kể". Làm thế nào bạn sẽ nhìn vào tất cả chúng.
user1357015

Nếu bạn muốn chỉnh sửa câu hỏi của mình, điều đó tốt, nhưng có lẽ tốt hơn là làm nó trong chính câu hỏi, để mọi người nhìn thấy nó trước. Nhưng tôi không kiện "Bạn trông như thế nào về tất cả chúng" nghĩa là gì.
Peter Flom - Tái lập Monica

Câu trả lời:


10

Bạn đúng. Các vấn đề của nhiều so sánh tồn tại ở khắp mọi nơi, nhưng, vì cách nó thường dạy, người ta chỉ nghĩ rằng nó gắn liền với việc so sánh nhiều nhóm với nhau thông qua một bó toàn bộ -tests. Trong thực tế, có nhiều ví dụ tồn tại vấn đề so sánh nhiều, nhưng ở đó nó không giống như nhiều so sánh cặp đôi; ví dụ: nếu bạn có nhiều biến liên tục và bạn tự hỏi liệu có bất kỳ biến tương quan nào không, bạn sẽ có một vấn đề so sánh nhiều lần (xem ở đây: Nhìn và bạn sẽ tìm thấy một mối tương quan ). t

Một ví dụ khác là một trong những bạn nâng cao. Nếu bạn đã chạy hồi quy bội với 20 biến và bạn đã sử dụng làm ngưỡng của mình, bạn sẽ mong đợi một trong các biến của mình là 'đáng kể' một cách tình cờ, ngay cả khi tất cả các giá trị đều đúng. Vấn đề của nhiều so sánh đơn giản đến từ toán học chạy rất nhiều phân tích. Nếu tất cả các giả thuyết null là đúng và các biến hoàn toàn không tương thích, xác suất không từ chối bất kỳ null thực nào sẽ là (ví dụ: với , đây là ). α=.051(1α)pp=5.23

Chiến lược đầu tiên để giảm thiểu điều này là tiến hành thử nghiệm đồng thời mô hình của bạn. Nếu bạn đang thực hiện hồi quy OLS, hầu hết các phần mềm sẽ cung cấp cho bạn -test toàn cầu làm phần mặc định của đầu ra. Nếu bạn đang chạy một mô hình tuyến tính tổng quát, hầu hết các phần mềm sẽ cung cấp cho bạn một bài kiểm tra tỷ lệ khả năng toàn cầu tương tự. Thử nghiệm này sẽ cung cấp cho bạn một số bảo vệ chống lại lạm phát lỗi loại I do vấn đề so sánh nhiều lần (xem, câu trả lời của tôi ở đây: Ý nghĩa của các hệ số trong hồi quy tuyến tính: kiểm tra t đáng kể so với thống kê F không đáng kể ). Một trường hợp tương tự là khi bạn có một biến phân loại được biểu thị bằng một số mã giả; bạn sẽ không muốn giải thích nhữngFt-tests, nhưng sẽ bỏ tất cả các mã giả và thực hiện một thử nghiệm mô hình lồng nhau thay thế.

Một chiến lược khả thi khác là sử dụng quy trình điều chỉnh alpha, như hiệu chỉnh Bonferroni. Bạn nên nhận ra rằng làm điều này sẽ làm giảm sức mạnh của bạn cũng như giảm tỷ lệ lỗi loại I của gia đình bạn. Liệu sự đánh đổi này có đáng hay không là một lời kêu gọi phán xét để bạn thực hiện. (FWIW, tôi thường không sử dụng hiệu chỉnh alpha trong hồi quy bội.)

Liên quan đến vấn đề sử dụng giá trị để thực hiện lựa chọn mô hình, tôi nghĩ đây là một ý tưởng thực sự tồi tệ. Tôi sẽ không chuyển từ một mô hình có 5 biến sang một biến chỉ có 2 biến vì các mô hình khác là 'không đáng kể'. Khi mọi người làm điều này, họ thiên vị mô hình của họ. Nó có thể giúp bạn đọc câu trả lời của tôi ở đây: các thuật toán để lựa chọn mô hình tự động để hiểu điều này tốt hơn. p

Về cập nhật của bạn, tôi sẽ không đề nghị bạn đánh giá các mối tương quan đơn biến trước để quyết định sử dụng biến nào trong mô hình hồi quy bội cuối cùng. Làm điều này sẽ dẫn đến các vấn đề với tính nội sinh trừ khi các biến hoàn toàn không tương quan với nhau. Tôi đã thảo luận vấn đề này trong câu trả lời của mình ở đây: Ước tính thay vìb1x1+b2x2b1x1+b2x2+b3x3 .

Đối với câu hỏi về cách xử lý các phân tích với các biến phụ thuộc khác nhau, việc bạn có muốn sử dụng một số loại điều chỉnh hay không dựa trên cách bạn thấy các phân tích liên quan đến nhau. Ý tưởng truyền thống là xác định xem họ có được coi là một "gia đình" hay không. Điều này được thảo luận ở đây: Điều gì có thể là một định nghĩa rõ ràng, thực tế cho một "gia đình giả thuyết"? Bạn cũng có thể muốn đọc chủ đề này: Phương pháp để dự đoán nhiều biến phụ thuộc .


Cảm ơn vì điều này. Đó chỉ là những gì tôi cần. Về nhận xét đồng nhất của bạn. Điều đó có ý nghĩa, nhưng có vẻ như nếu tôi thực hiện chỉnh sửa Bonferroni bảo thủ trên các giá trị p tương quan, ngay cả khi có sự đồng thuận, thì việc hiệu chỉnh bonferroni có nên giải thích không?
user1357015

Hiệu chỉnh Bonferroni không liên quan đến tính nội sinh. Nếu các đồng biến của bạn hoàn toàn tương quan với nhau, thì các tương quan XY đơn biến sẽ là các ước tính sai lệch của mối quan hệ. Bạn nên phù hợp với mô hình bạn dự định phù hợp và dừng lại ở đó. Nói chung, không có nhu cầu thực sự để đi thêm nữa. Nếu bạn cần tạo một mô hình dự đoán thực sự, bạn nên sử dụng xác nhận chéo hoặc các kỹ thuật khác phù hợp với điều đó.
gung - Phục hồi Monica

0

Ở mức độ thực tế, tôi nghĩ người ta cũng cần xem xét nếu Betas phản ánh mức độ của một biến phân loại (ví dụ như các hình nộm). Trong những trường hợp này, thật hợp lý khi quan tâm đến việc liệu một Beta nhất định có khác so với Beta giới thiệu (có ý nghĩa) hay không. Nhưng trước cả khi thực hiện so sánh cặp, người ta sẽ cần phải biết liệu tổng các mức của biến phân loại có quan trọng hay không (sử dụng phép thử F chung hoặc phép thử tỷ lệ khả năng). Làm điều này có lợi thế của việc sử dụng ít df

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.