Bạn đúng. Các vấn đề của nhiều so sánh tồn tại ở khắp mọi nơi, nhưng, vì cách nó thường dạy, người ta chỉ nghĩ rằng nó gắn liền với việc so sánh nhiều nhóm với nhau thông qua một bó toàn bộ -tests. Trong thực tế, có nhiều ví dụ tồn tại vấn đề so sánh nhiều, nhưng ở đó nó không giống như nhiều so sánh cặp đôi; ví dụ: nếu bạn có nhiều biến liên tục và bạn tự hỏi liệu có bất kỳ biến tương quan nào không, bạn sẽ có một vấn đề so sánh nhiều lần (xem ở đây: Nhìn và bạn sẽ tìm thấy một mối tương quan ). t
Một ví dụ khác là một trong những bạn nâng cao. Nếu bạn đã chạy hồi quy bội với 20 biến và bạn đã sử dụng làm ngưỡng của mình, bạn sẽ mong đợi một trong các biến của mình là 'đáng kể' một cách tình cờ, ngay cả khi tất cả các giá trị đều đúng. Vấn đề của nhiều so sánh đơn giản đến từ toán học chạy rất nhiều phân tích. Nếu tất cả các giả thuyết null là đúng và các biến hoàn toàn không tương thích, xác suất không từ chối bất kỳ null thực nào sẽ là (ví dụ: với , đây là ). α=.051−(1−α)pp=5.23
Chiến lược đầu tiên để giảm thiểu điều này là tiến hành thử nghiệm đồng thời mô hình của bạn. Nếu bạn đang thực hiện hồi quy OLS, hầu hết các phần mềm sẽ cung cấp cho bạn -test toàn cầu làm phần mặc định của đầu ra. Nếu bạn đang chạy một mô hình tuyến tính tổng quát, hầu hết các phần mềm sẽ cung cấp cho bạn một bài kiểm tra tỷ lệ khả năng toàn cầu tương tự. Thử nghiệm này sẽ cung cấp cho bạn một số bảo vệ chống lại lạm phát lỗi loại I do vấn đề so sánh nhiều lần (xem, câu trả lời của tôi ở đây: Ý nghĩa của các hệ số trong hồi quy tuyến tính: kiểm tra t đáng kể so với thống kê F không đáng kể ). Một trường hợp tương tự là khi bạn có một biến phân loại được biểu thị bằng một số mã giả; bạn sẽ không muốn giải thích nhữngFt-tests, nhưng sẽ bỏ tất cả các mã giả và thực hiện một thử nghiệm mô hình lồng nhau thay thế.
Một chiến lược khả thi khác là sử dụng quy trình điều chỉnh alpha, như hiệu chỉnh Bonferroni. Bạn nên nhận ra rằng làm điều này sẽ làm giảm sức mạnh của bạn cũng như giảm tỷ lệ lỗi loại I của gia đình bạn. Liệu sự đánh đổi này có đáng hay không là một lời kêu gọi phán xét để bạn thực hiện. (FWIW, tôi thường không sử dụng hiệu chỉnh alpha trong hồi quy bội.)
Liên quan đến vấn đề sử dụng giá trị để thực hiện lựa chọn mô hình, tôi nghĩ đây là một ý tưởng thực sự tồi tệ. Tôi sẽ không chuyển từ một mô hình có 5 biến sang một biến chỉ có 2 biến vì các mô hình khác là 'không đáng kể'. Khi mọi người làm điều này, họ thiên vị mô hình của họ. Nó có thể giúp bạn đọc câu trả lời của tôi ở đây: các thuật toán để lựa chọn mô hình tự động để hiểu điều này tốt hơn. p
Về cập nhật của bạn, tôi sẽ không đề nghị bạn đánh giá các mối tương quan đơn biến trước để quyết định sử dụng biến nào trong mô hình hồi quy bội cuối cùng. Làm điều này sẽ dẫn đến các vấn đề với tính nội sinh trừ khi các biến hoàn toàn không tương quan với nhau. Tôi đã thảo luận vấn đề này trong câu trả lời của mình ở đây: Ước tính thay vìb1x1+b2x2b1x1+b2x2+b3x3 .
Đối với câu hỏi về cách xử lý các phân tích với các biến phụ thuộc khác nhau, việc bạn có muốn sử dụng một số loại điều chỉnh hay không dựa trên cách bạn thấy các phân tích liên quan đến nhau. Ý tưởng truyền thống là xác định xem họ có được coi là một "gia đình" hay không. Điều này được thảo luận ở đây: Điều gì có thể là một định nghĩa rõ ràng, thực tế cho một "gia đình giả thuyết"? Bạn cũng có thể muốn đọc chủ đề này: Phương pháp để dự đoán nhiều biến phụ thuộc .