Làm thế nào để bạn chọn các biến trong một mô hình hồi quy?


12

Cách tiếp cận truyền thống để lựa chọn biến là tìm các biến đóng góp nhiều nhất để dự đoán một phản ứng mới. Gần đây tôi đã biết về một sự thay thế cho điều này. Trong mô hình các biến xác định hiệu quả của điều trị - ví dụ như trong một thử nghiệm lâm sàng về dược phẩm - biến được cho là tương tác định tínhvới điều trị nếu, để những thứ khác cố định, một sự thay đổi trong biến đó có thể tạo ra một sự thay đổi trong đó điều trị có hiệu quả nhất. Các biến này không phải lúc nào cũng là yếu tố dự báo mạnh về tác dụng nhưng có thể quan trọng đối với bác sĩ khi quyết định điều trị cho từng bệnh nhân. Trong luận án tiến sĩ của mình, Lacey Gunter đã phát triển một phương pháp để chọn các biến tương tác định tính này có thể bị bỏ qua bởi các thuật toán lựa chọn cơ sở dựa trên dự đoán. Gần đây tôi đã làm việc với cô ấy về việc mở rộng các phương pháp này sang các mô hình khác bao gồm hồi quy logistic và mô hình hồi quy nguy cơ theo tỷ lệ Cox.

Tôi có hai câu hỏi:

  1. Bạn nghĩ gì về giá trị của các phương pháp mới này?
  2. Trong trường hợp của các phương pháp truyền thống, bạn thích cách tiếp cận nào? Các tiêu chí như AIC, BIC, Mallows Cp, F kiểm tra để nhập hoặc thả các biến theo từng bước, tiến và lùi ...

Bài báo đầu tiên về điều này xuất hiện trong Gunter, L., Zhu, J và Murphy, SA (2009). Lựa chọn biến cho các tương tác định tính . Phương pháp thống kê doi: 10, 1016 / j.stamet.2009.05.003.

Bài báo tiếp theo xuất hiện trong Gunter, L., Zhu, J. và Murphy, SA (2011). Lựa chọn thay đổi các tương tác định tính trong y học cá nhân trong khi kiểm soát tỷ lệ lỗi gia đình . Tạp chí Thống kê dược phẩm sinh học 21, 1063-1078.

Cái tiếp theo xuất hiện trong một vấn đề đặc biệt về lựa chọn biến Gunter, L., Chernick, MR và Sun, J. (2011). Một phương pháp đơn giản để lựa chọn biến trong hồi quy đối với lựa chọn điều trị . Tạp chí Nghiên cứu Thống kê và Hoạt động Pakistan 7: 363-380.

Bạn có thể tìm thấy các giấy tờ tại các trang web tạp chí. Bạn có thể phải mua bài viết. Tôi có thể có các tập tin pdf cho các bài viết này. Lacey và tôi vừa hoàn thành một chuyên khảo về chủ đề này sẽ được xuất bản dưới dạng SpringerBrief vào cuối năm nay.


11
Có thể tôi không theo dõi - nếu có một lý do tiên quyết để nghi ngờ sửa đổi hiệu ứng, thì các phương thức mới này khác nhau như thế nào, ví dụ, bao gồm các thuật ngữ tương tác trong danh sách các biến "ứng cử viên" để lựa chọn mô hình?
Macro

6
(1) Một hoặc nhiều dòng dường như đã bị mất trong câu hỏi này. Tôi đoán nó có thể tiếp tục "từng bước, tiến và lùi, ..." (2) Nhận dạng mô hình và lựa chọn biến đã được thảo luận rộng rãi ở đây. Ví dụ, tìm kiếm trên + model + biến + lựa chọn trình bày 145 chủ đề tại thời điểm này. Thu hẹp tìm kiếm đó có thể sẽ trả lời câu hỏi thứ hai. (3) Để tạo điều kiện trả lời cho câu hỏi đầu tiên, bạn có thể cung cấp một liên kết hoặc tài liệu tham khảo rõ ràng cho nghiên cứu này không?
whuber

2
Đây là một vấn đề bao gồm một biến tương tác với điều trị. Nhưng nó là một tương tác định tính không chỉ là một tương tác đơn giản. Để tương tác hai dòng không được song song. Để tương tác định tính, chúng phải giao nhau trong khoảng thời gian mà biến được xác định. Vì vậy, ý tưởng là tìm một biến tương tác định tính. Điều này khác với việc chọn các biến và thuật ngữ tương tác để cải thiện sự phù hợp hoặc dự đoán.
Michael R. Chernick

3
Cảm ơn đã nhân cơ hội trả lời, Michael. Có lẽ một điểm quan trọng để đưa ra là trang web này không phải là một trang thảo luận, mà là một trang web hỏi đáp. Cùng với đó là một số phương thức giao tiếp hơi khác nhau. Câu hỏi thường gặp bao gồm điều này trong một số chi tiết. Đôi khi các luồng có thể bị mất một chút, nhưng tôi thực sự hiếm thấy một cách đáng ngạc nhiên, một khi có thêm một chút kinh nghiệm với sơ đồ chung của mọi thứ. Chúc mừng.
Đức hồng y

6
Michael, vâng, hệ thống SE có một số quen thuộc và không hoàn hảo. Nhưng nó có ý nghĩa và nó phù hợp. Một điều chúng tôi hướng đến là cải tiến liên tục : không giống như các máy chủ danh sách và bảng thông báo, câu hỏi (và câu trả lời) có thể được sửa đổi; điều này được mong đợi Cuối cùng, chúng tôi muốn một chủ đề bắt đầu với một câu hỏi hoàn chỉnh, được nêu rõ, hoàn toàn tự đứng mà không cần tham khảo chủ đề bình luận; sau đó nó nên tiếp tục với một hoặc nhiều câu trả lời chính tắc được viết tốt, được quy kết tốt. Với lý tưởng này, các đề xuất của @ cardinal có thể có ý nghĩa hơn đối với bạn.
whuber

Câu trả lời:


2
  1. Xem Gelman và Hill, Phân tích dữ liệu bằng cách sử dụng hồi quy và mô hình đa cấp / phân cấp pg 69, họ có một phần về lựa chọn mô hình. Cô ấy đang sử dụng một cách tiếp cận dựa trên câu hỏi hoàn toàn tốt nhưng trong bài viết của mình, cô ấy cần phải giải thích lý do tại sao cô ấy bao gồm những gì cô ấy đã làm trong mô hình. Giống như bạn đã nói "Những biến số này không phải lúc nào cũng là yếu tố dự báo mạnh mẽ về tác dụng nhưng có thể quan trọng đối với bác sĩ khi quyết định điều trị cho từng bệnh nhân." Vì vậy, miễn là cô ấy biện minh lý do tại sao những dự đoán này nên được đưa vào thì nó vẫn ổn. Đối với cá nhân tôi, tôi thích những phương pháp này. Vì vậy, đây là câu trả lời của tôi cho 2.
  2. Từng bước, tiến và lùi tôi nghĩ là những hộp đen. Khi bạn chạy một mô hình thông qua cả ba, bạn sẽ không đến cùng một dự đoán. Vì vậy, về mặt sử dụng tôi sẽ không có câu trả lời rõ ràng. AIC hoặc BIC được sử dụng để so sánh các mô hình.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.