Suy luận dựa trên mô hình hồi quy đầy đủ (toàn cầu) có phù hợp không?


7

Là suy luận dựa trên một mô hình đầy đủ thích hợp, và nếu vậy, trong trường hợp nào?

Giả sử bạn quan tâm đến mối quan hệ tiềm năng giữa một biến trả lời và một số biến dự đoán ứng viên và sử dụng một số dạng hồi quy (ví dụ mô hình tuyến tính tổng quát) để trả lời điều đó. Một cách tiếp cận để suy ra dự đoán nào là "quan trọng" hoặc có mối quan hệ rõ ràng thực sự với phản hồi sẽ là so sánh mô hình dựa trên tiêu chí lý thuyết thông tin (nói AIC). Mặc dù các biến không được giữ lại trong mô hình cuối cùng có thể có một số mối quan hệ với phản hồi, nhưng về cơ bản chúng không cung cấp thêm thông tin quan trọng nào, do các yếu tố dự đoán khác được giữ lại trong mô hình.

Có trường hợp nào phù hợp hơn khi chỉ phù hợp với một mô hình (toàn cầu) đầy đủ (với tất cả các dự đoán ứng viên), dừng lại ở đó và suy luận dựa trên các dự đoán riêng lẻ chỉ dựa trên thống kê t (hoặc thống kê khác) và giá trị p trong mô hình đầy đủ này, mà không cần lựa chọn mô hình nữa?

Tôi đã bắt gặp những gợi ý (ví dụ Whmitham et al. "Tại sao chúng ta vẫn sử dụng mô hình hóa từng bước trong sinh thái học và hành vi?" (2006) rằng đây có thể là một điều hợp lý để làm, mặc dù có những hạn chế tiềm năng. không thiên vị, nhưng các nguồn khác nói rằng các ước tính và giá trị p này không đáng tin cậy, vì các biến khác ("không quan trọng") trong mô hình có thể ảnh hưởng đến chúng.

Nếu mục đích là để hiểu các mối quan hệ sinh học tiềm năng, phương pháp nào sẽ phù hợp hơn?


Vui lòng cung cấp "các nguồn khác" được đề cập để giúp cải thiện câu trả lời dưới đây.
mzunhammer

@mzunhammer, tôi muốn làm điều đó ngay từ đầu, nhưng không thể theo dõi các nguồn đó một lần nữa. Tôi không thể nhớ mình đã đọc tờ giấy nào và chưa thể tìm thấy nó. :) Sẽ tiếp tục tìm kiếm mặc dù.
Tilen

Câu trả lời:


4

Tất cả phụ thuộc vào mục đích học tập của bạn:

A) Nghiên cứu khám phá : Mục đích của bạn là sàng lọc một số dự đoán thú vị tiềm năng cho các mối quan hệ. Bạn muốn xây dựng một mô hình thử nghiệm dựa trên các kết quả thăm dò này. Không có suy luận (theo nghĩa thử nghiệm giả thuyết không có ý nghĩa), hoặc các quyết định quan trọng khác được rút ra từ nghiên cứu. Nghiên cứu này là một thí điểm và sẽ được theo sau bởi một nghiên cứu xác nhận / được chỉ định trước. Trong trường hợp này, các quy trình lựa chọn mô hình (sử dụng AIC, BIC hoặc các kỹ thuật xác thực chéo) là các phương pháp bạn chọn. Tham chiếu mà bạn đã trích dẫn là chính xác: Các giá trị p thu được cho các yếu tố dự đoán trong mô hình cuối cùng sẽ rất lạc quan: Bằng cách thử nhiều mô hình khác nhau trong lựa chọn mô hình, bạn đã tạo ra một vấn đề so sánh nhiều - "khu vườn của các đường dẫn". Các thử nghiệm thống kê thông thường sẽ mang lại cho bạn giá trị p cho mô hình hiện tại và không kiểm soát đối với nhiều so sánh này.

B) Nghiên cứu xác nhận / "được chỉ định trước" : Trong trường hợp này, bạn nên thử nghiệm một mô hình duy nhất - mô hình được chỉ định trước trước khi nghiên cứu được thực hiện. Nếu bạn có lý do chính đáng để tin trước khi nghiên cứu bắt đầu rằng tất cả các dự đoán của bạn đang có hiệu lực thì mô hình đầy đủ là một lựa chọn tự nhiên. Nếu bạn bao gồm một số dự đoán về sự nghi ngờ đơn thuần, bạn có thể thực hiện một nghiên cứu thăm dò.

Các biến "không quan trọng", tức là các biến không giải thích nhiều phương sai trong biến kết quả, sẽ chỉ gây ảnh hưởng quá mức đến dữ liệu của bạn nếu bạn có quá nhiều yếu tố dự đoán so với kích thước mẫu của bạn (quá mức) hoặc nếu có các yếu tố dự đoán cao tương quan (collinear). Lý tưởng nhất là bạn tránh những tình huống này bằng cách thực hiện một nghiên cứu thăm dò.

Một cách để kiểm tra các vấn đề mô hình quá mức / không ổn định là bằng cách khám phá "mô hình rút gọn" chỉ bao gồm các thuật ngữ "đáng kể" từ mô hình chính. Điều quan trọng, phân tích mô hình giảm này nên được gọi là một giải thích hỗ trợ phân tích kiểm soát sau hoc. Kết luận chỉ nên dựa trên mô hình được chỉ định trước.


cảm ơn, điều này rất hữu ích Đối với điểm cuối cùng của bạn, một khi bạn đã trang bị mô hình đầy đủ và mô hình rút gọn này (chỉ với các điều khoản "đáng kể"), bạn sẽ dựa vào so sánh nào?
Tilen

Thực tế của tôi (trong sinh học) là thường có một loại kết hợp của hai điểm này. Chúng ta thường cố gắng suy luận các mối quan hệ trong tự nhiên, nhưng đồng thời cố gắng để có thể dự đoán (mặc dù theo một cách khám phá).
Tilen

Về câu hỏi đầu tiên của bạn: bạn có ý nghĩa gì khi so sánh? Như đã nêu ở trên, tất cả các suy luận phải dựa trên mô hình được chỉ định trước. Về câu hỏi thứ hai: Trộn lẫn thăm dò và suy luận cũng được gọi là "dự đoán" và sẽ đưa bạn đến những kết quả không đáng tin cậy. Tất cả phụ thuộc vào mục tiêu của bạn. Bạn phải có được sự rõ ràng cho chính mình cho dù bạn muốn khám phá, suy luận hoặc đưa ra dự đoán.
mzunhammer

Bạn nói rằng "một cách để kiểm tra các vấn đề mô hình quá mức / không ổn định là bằng cách khám phá" mô hình rút gọn "chỉ bao gồm các thuật ngữ" đáng kể "từ mô hình chính." Vậy làm thế nào để bạn khám phá mô hình giảm này? Tôi nghĩ rằng bạn có nghĩa là để so sánh nó với đầy đủ bằng cách nào đó (đó là lý do tại sao tôi viết so sánh). Liên quan đến điểm thứ hai, tôi không chắc mình hiểu đầy đủ về sự khác biệt giữa khám phá các mối quan hệ so với suy luận về các mối quan hệ này ...
Tilen

Tạo mô hình rút gọn là bước thăm dò. Bạn nên kiểm tra xem có yếu tố nào xuất hiện có ý nghĩa trong phân tích chính hay không, nhưng không phải trong mô hình rút gọn. Nếu điều này xảy ra, bạn nên kiểm tra tại sao. Về nghiên cứu thăm dò và nghiên cứu suy luận: Hãy xem các tài liệu tham khảo được trích dẫn ở trên.
mzunhammer 17/03/2017
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.