Chúng ta có thực sự cần bao gồm những người dự đoán có liên quan không?


15

Một giả định cơ bản của việc sử dụng các mô hình hồi quy để suy luận là "tất cả các dự đoán có liên quan" đã được đưa vào phương trình dự đoán. Lý do là việc không bao gồm một yếu tố trong thế giới thực quan trọng dẫn đến các hệ số sai lệch và do đó suy luận không chính xác (nghĩa là bỏ qua sai lệch biến).

Nhưng trong thực tế nghiên cứu, tôi chưa bao giờ thấy bất kỳ ai bao gồm bất cứ điều gì giống như "tất cả các dự đoán có liên quan". Nhiều hiện tượng có vô số nguyên nhân quan trọng, và sẽ rất khó, nếu không nói là không thể, bao gồm tất cả chúng. Một ví dụ điển hình là mô hình trầm cảm như một kết quả: Không ai đã xây dựng bất cứ điều gì gần gũi với một mô hình bao gồm "tất cả các biến có liên quan": ví dụ: lịch sử của cha mẹ, đặc điểm tính cách, hỗ trợ xã hội, thu nhập, tương tác của họ, v.v. Vân vân...

Hơn nữa, việc lắp một mô hình phức tạp như vậy sẽ dẫn đến các ước tính rất không ổn định trừ khi có các cỡ mẫu rất lớn.

Câu hỏi của tôi rất đơn giản: Có phải giả định / lời khuyên để "bao gồm tất cả các dự đoán có liên quan" chỉ là một cái gì đó mà chúng tôi "nói" nhưng thực sự không bao giờ có nghĩa? Nếu không, tại sao chúng ta cho nó như một lời khuyên mô hình thực tế?

Và điều này có nghĩa là hầu hết các hệ số có thể gây hiểu nhầm? (ví dụ, một nghiên cứu về các yếu tố tính cách và trầm cảm chỉ sử dụng một số yếu tố dự đoán). Nói cách khác, vấn đề này lớn đến mức nào đối với kết luận của khoa học chúng ta?


6
Một phiên bản của lập luận này nổi lên trong tâm lý học, kinh tế và khoa học xã hội trong suốt thế kỷ 19. Các nhà khoa học cho rằng phương pháp thống kê không thể áp dụng được cho con người và các hệ thống xã hội vì con người quá đa dạng và phức tạp. Vào cuối thế kỷ đó, tiện ích đã chiến thắng triết lý: ngay cả khi chúng ta không bao gồm tất cả các dự đoán, chúng ta vẫn có thể học được rất nhiều. Có sự khôn ngoan trong việc bao gồm "có liên quan" trong cụm từ tiêu đề.
whuber

Câu trả lời:


18

Bạn đã đúng - chúng tôi hiếm khi thực tế khi nói "tất cả các dự đoán có liên quan". Trong thực tế chúng ta có thể hài lòng với bao gồm dự đoán rằng giải thích các nguồn chính của sự thay đổi trong . Trong trường hợp đặc biệt rút ra suy luận về một yếu tố rủi ro hoặc điều trị trong một nghiên cứu quan sát, điều này hiếm khi đủ tốt. Do đó, việc điều chỉnh gây nhiễu cần phải hết sức căng thẳng, bao gồm các biến thể liên quan đến kết quả và thể liên quan đến lựa chọn điều trị hoặc yếu tố rủi ro mà bạn đang cố gắng công khai.Y

Điều thú vị là với mô hình tuyến tính bình thường, các hiệp phương sai bị bỏ qua, đặc biệt là nếu trực giao với các hiệp phương sai, có thể được coi là chỉ mở rộng thuật ngữ lỗi. Trong các mô hình phi tuyến (logistic, Cox, nhiều người khác) bỏ qua các biến có thể làm sai lệch ảnh hưởng của tất cả các biến có trong mô hình (ví dụ do không thể thu gọn tỷ lệ chênh lệch).


Cảm ơn bạn đã thông tin hữu ích. Đặt sang một bên đánh giá hiệu quả điều trị, tôi muốn hỏi thêm về ý nghĩa thực dụng của vấn đề này. Nếu bạn xem xét một bài báo và có những dự đoán rõ ràng quan trọng bị bỏ qua, đó có thể là căn cứ để từ chối? Tôi hỏi điều này bởi vì a.) Tôi chưa bao giờ nghe về điều này xảy ra và b) dựa trên nhu cầu đo lường hiệu quả hơn).
ATJ

Chẳng hạn, không có gì lạ khi thấy một mô hình biến tiềm ẩn chỉ có một yếu tố dự đoán SINGLE cho một biến nội sinh. Điều này có nói lên khoảng cách giữa lĩnh vực thống kê và việc thực hiện nó trong các lĩnh vực chủ đề thực tế không?
ATJ

6
Nó có thể làm được. Đối với các cơ sở câu hỏi trước đó để từ chối sẽ bao gồm thiếu sót các biến quan trọng mà sự bao gồm của nó sẽ đưa ra một cách giải thích khác về các biến được bao gồm, hoặc sẽ thay đổi mạnh mẽ mô hình. Tôi đã từng xem xét một bài báo về nguy cơ ung thư phổi chỉ có sẵn cho dù đối tượng đã từng hút thuốc hay chưa, và các tác giả đã không cố gắng đánh giá liều lượng thuốc lá (ví dụ: năm gói). Tôi đề nghị từ chối thẳng thừng.
Frank Harrell

9

Có, bạn phải bao gồm tất cả "các biến có liên quan", nhưng bạn phải thông minh về nó. Bạn phải nghĩ ra các cách để xây dựng các thí nghiệm tách biệt tác động của hiện tượng của bạn khỏi những thứ không liên quan, đó là rất nhiều trong thế giới thực (trái ngược với nghiên cứu trong lớp học). Trước khi bạn có được số liệu thống kê, bạn phải thực hiện các công việc nặng nề trong miền của mình chứ không phải trong thống kê.

Tôi khuyến khích bạn không nên hoài nghi về việc bao gồm tất cả các biến có liên quan, bởi vì đó không chỉ là mục tiêu cao cả mà còn bởi vì nó thường có thể. Chúng tôi không nói điều này chỉ vì lợi ích của nó. Chúng tôi thực sự có nghĩa là nó. Trong thực tế, thiết kế các thí nghiệm và nghiên cứu có thể bao gồm tất cả các biến có liên quan là điều làm cho khoa học thực sự thú vị và khác với "thí nghiệm" của nồi hơi cơ học.

Để thúc đẩy tuyên bố của tôi, tôi sẽ cho bạn một ví dụ về cách Galileo nghiên cứu gia tốc. Dưới đây là mô tả của anh ấy về một thử nghiệm thực tế (từ trang web này ):

Một mảnh đúc hoặc scantling bằng gỗ, dài khoảng 12 khối, rộng một nửa khối và dày ba ngón tay, đã được lấy; trên cạnh của nó đã bị cắt một kênh nhiều hơn một ngón tay theo chiều rộng; đã làm cho rãnh này rất thẳng, mịn và được đánh bóng, và được lót bằng giấy da, cũng mịn và bóng nhất có thể, chúng tôi lăn dọc theo nó một quả bóng đồng cứng, mịn và rất tròn. Đặt tấm ván này ở vị trí dốc, bằng cách nâng một đầu một hoặc hai khối lên trên đầu kia, chúng tôi lăn quả bóng, như tôi vừa nói, dọc theo kênh, lưu ý, theo cách hiện tại được mô tả, thời gian cần thiết để làm cho hậu duệ. Chúng tôi đã lặp lại thí nghiệm này hơn một lần để đo thời gian với độ chính xác sao cho độ lệch giữa hai lần quan sát không bao giờ vượt quá một phần mười nhịp đập. Đã thực hiện thao tác này và tự đảm bảo độ tin cậy của nó, giờ đây chúng tôi đã lăn quả bóng chỉ bằng một phần tư chiều dài của kênh; và khi đo thời gian gốc của nó, chúng tôi thấy nó chính xác bằng một nửa so với trước đây. Tiếp theo, chúng tôi đã thử các khoảng cách khác, so sánh thời gian cho toàn bộ chiều dài với một nửa hoặc với khoảng cách đó cho hai phần ba, hoặc ba phần tư, hoặc thực sự cho bất kỳ phân số nào; trong các thí nghiệm như vậy, lặp đi lặp lại cả trăm lần, chúng tôi luôn thấy rằng các không gian đi qua nhau là bình phương của thời đại, và điều này đúng với mọi khuynh hướng của mặt phẳng, tức là của kênh, dọc theo đó chúng tôi lăn trái bóng. Chúng tôi cũng quan sát thấy rằng thời gian hạ xuống, đối với các độ nghiêng khác nhau của mặt phẳng, mang lại cho nhau chính xác tỷ lệ đó, như chúng ta sẽ thấy sau này,

Để đo thời gian, chúng tôi sử dụng một bình nước lớn đặt ở vị trí cao; dưới đáy của con tàu này được hàn một ống có đường kính nhỏ tạo ra một tia nước mỏng mà chúng tôi thu được trong một chiếc cốc nhỏ trong suốt thời gian của mỗi lần hạ xuống, cho dù là toàn bộ chiều dài của kênh hay cho một phần chiều dài của nó; Do đó, nước được thu thập được cân, sau mỗi lần hạ xuống, trên một sự cân bằng rất chính xác; sự khác biệt và tỷ lệ của các trọng số này đã cho chúng tôi sự khác biệt và tỷ lệ của thời đại, và điều này với độ chính xác đến mức mặc dù hoạt động được lặp lại nhiều lần, nhiều lần, không có sự khác biệt đáng kể nào trong kết quả.

d=gt2,
dgtd0=1t0ditid0/dit02/ti2
d0di=t02ti2
.

Hãy chú ý đến cách anh ấy đo thời gian. Thật thô thiển đến nỗi nó nhắc nhở tôi làm thế nào những ngày này khoa học không tự nhiên đo lường các biến số của họ, nghĩ về "sự hài lòng của khách hàng" hay "tiện ích". Ông đề cập rằng sai số đo là trong vòng mười đơn vị thời gian, btw.

Có phải anh ấy bao gồm tất cả các biến có liên quan? Vâng, anh ấy đã làm. Bây giờ, bạn phải hiểu rằng tất cả các cơ thể bị thu hút lẫn nhau bởi trọng lực. Vì vậy, theo lý thuyết để tính toán lực chính xác lên quả bóng, bạn phải thêm mọi vật thể trong vũ trụ vào phương trình. Hơn nữa, quan trọng hơn nhiều là anh ta không bao gồm sức cản bề mặt, lực cản không khí, động lượng góc v.v ... Tất cả những điều này có ảnh hưởng đến các phép đo của anh ta không? Đúng. Tuy nhiên, chúng không liên quan đến những gì anh ta đang nghiên cứu vì anh ta có thể giảm hoặc loại bỏ tác động của họ bằng cách cô lập tác động của tài sản mà anh ta đang nghiên cứu.

t2


Điều gì quá thô thiển về phương pháp đo thời gian của anh ấy? Thiết lập sẽ có một tỷ lệ cụ thể mà tại đó nước sẽ rời khỏi tàu lớn và đi vào cốc; giả sử tàu chứa một lượng nước lớn, tốc độ đó sẽ thay đổi tối thiểu. Quan trọng hơn, nó sẽ vẫn nhất quán trong các thí nghiệm. Đó thực sự là một phương pháp rất thanh lịch khi họ không có đồng hồ bấm giờ và bộ hẹn giờ tự động lạ mắt hồi đó.
JAB

@JAB, dĩ nhiên chỉ là so sánh với việc dừng xem hoặc các cách hiện đại để đo thời gian. Bạn hoàn toàn đúng khi nói rằng nó rất thanh lịch với trạng thái nghệ thuật đo thời gian trong những ngày của Galileo. Tuy nhiên, điểm tôi đang đưa ra là ngay cả độ chính xác dường như thấp như vậy (1/10 của một khoảng) vẫn đủ để quan sát mối quan hệ giữa thời gian và khoảng cách
Aksakal

@JAB, một trong những ví dụ yêu thích của tôi về các phương pháp đo lường lố bịch trong vật lý là cách Cherenkov phát hiện ra bức xạ của mình . Anh ta ngồi trong một căn phòng tối cho đến khi mắt anh ta được điều chỉnh thành bóng tối, sau đó anh ta mở hoặc đóng lỗ với ánh sáng phát ra từ đó cho đến khi ánh sáng biến mất. Anh ta sẽ ghi lại bao nhiêu lỗ đã được mở để phát hiện mức độ phóng xạ. Rõ ràng, mắt người có thể phát hiện sự khác biệt về ánh sáng được đo trong một số ít photon! Bài viết dài 3 trang.
Aksakal

6

Để các giả định của mô hình hồi quy giữ hoàn hảo, phải bao gồm tất cả các dự đoán có liên quan. Nhưng không có giả định nào trong bất kỳ phân tích thống kê nào nắm giữ hoàn hảo và phần lớn thực hành thống kê dựa trên "Đóng đủ".

Với Thiết kế các thí nghiệm và ngẫu nhiên thích hợp, ảnh hưởng của các thuật ngữ không có trong các mô hình thường có thể bị bỏ qua (được giả định bằng cơ hội ngẫu nhiên). Nhưng, hồi quy thường được sử dụng khi không thể tính ngẫu nhiên đầy đủ cho tất cả các biến có thể không có trong mô hình, vì vậy câu hỏi của bạn trở nên quan trọng.

Khá nhiều mô hình hồi quy từng phù hợp có thể thiếu một số dự đoán tiềm năng, nhưng "Tôi không biết" mà không làm rõ thêm sẽ không cho phép các nhà thống kê làm việc tiếp tục làm việc, vì vậy chúng tôi cố gắng hết sức và sau đó cố gắng tìm ra mức độ khác biệt giữa các giả định và thực tế sẽ ảnh hưởng đến kết quả của chúng tôi. Trong một số trường hợp, sự khác biệt so với các giả định tạo ra rất ít sự khác biệt và chúng tôi không lo lắng nhiều về sự khác biệt, nhưng trong các trường hợp khác, nó có thể rất nghiêm trọng.

Một lựa chọn khi bạn biết rằng có thể có các yếu tố dự đoán không được đưa vào mô hình có liên quan là phân tích độ nhạy. Điều này đo lường mức độ thiên vị có thể có thể dựa trên mối quan hệ tiềm năng với (các) biến không đo lường được. Tờ giấy này:

Lin, DY và ​​Psaty, BM và Kronmal, RA. (1998): Đánh giá độ nhạy của kết quả hồi quy đối với các yếu tố gây nhiễu không được đo lường trong các nghiên cứu quan sát. Sinh trắc học, 54 (3), tháng 9, trang 948-963.

đưa ra một số công cụ (và ví dụ) về phân tích độ nhạy.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.