Liệu Định lý Bữa trưa Không có Bữa trưa Miễn phí có áp dụng cho các bài kiểm tra thống kê chung không?


12

Một phụ nữ tôi đang làm việc đã yêu cầu tôi thực hiện ANOVA một chiều trên một số dữ liệu. Tôi trả lời rằng dữ liệu là dữ liệu lặp đi lặp lại (chuỗi thời gian) và tôi nghĩ rằng giả định độc lập đã bị vi phạm. Cô ấy trả lời rằng tôi không nên lo lắng về các giả định, chỉ cần làm bài kiểm tra và cô ấy sẽ tính đến việc các giả định có thể không được đáp ứng.

Điều đó dường như không đúng với tôi. Tôi đã thực hiện một số nghiên cứu và tìm thấy bài đăng trên blog tuyệt vời này của David Robinson, K-nghĩa là cụm không phải là một bữa ăn trưa miễn phí , điều này đưa tôi đến Định lý Không ăn trưa miễn phí. Tôi đã xem bài báo gốc và một số bài theo dõi, và thẳng thắn toán học là một chút trên đầu của tôi.

Ý chính của nó - theo David Robinson - dường như là sức mạnh của một bài kiểm tra thống kê xuất phát từ các giả định của nó. Và ông đưa ra hai ví dụ tuyệt vời. Khi tôi lướt qua các bài viết và bài đăng trên blog khác về nó, nó dường như luôn được tham chiếu trong điều kiện học tập hoặc tìm kiếm có giám sát.

Vì vậy, câu hỏi của tôi là, định lý này áp dụng cho các bài kiểm tra thống kê nói chung? Nói cách khác, người ta có thể nói rằng sức mạnh của bài kiểm tra t hay ANOVA xuất phát từ việc tuân thủ các giả định của nó và trích dẫn Định lý Không ăn trưa miễn phí?

Tôi nợ ông chủ cũ của tôi một tài liệu cuối cùng liên quan đến công việc tôi đã làm và tôi muốn biết liệu tôi có thể tham khảo Định lý Không ăn trưa miễn phí khi nói rằng bạn không thể bỏ qua các giả định của kiểm tra thống kê và nói rằng bạn sẽ thực hiện điều đó tài khoản khi đánh giá kết quả.


4
Tại sao bạn không thực hiện "bí mật" một biện pháp lặp đi lặp lại ANOVA?
Horst Grünbusch

1
@ HorstGrünbusch Trên thực tế, dữ liệu và thử nghiệm đã được thảo luận trên diễn đàn trước đó, với các câu hỏi cụ thể về các biện pháp lặp lại ANOVA, và hóa ra mô hình hiệu ứng hỗn hợp tuyến tính có lẽ là lựa chọn tốt nhất.
rwjones

2
Điều này đã được trả lời tốt, vì vậy một phản ứng nhanh hơn có thể được thêm vào. Bạn có thể hỏi sếp của bạn chính xác làm thế nào cô ấy sẽ tính đến hậu quả của việc vi phạm các giả định ("thận trọng" sẽ tốt hơn không có gì!). Nói tóm lại, đó là một con đường dài và khó để có đủ sự hiểu biết và kinh nghiệm để biết khi nào bạn có thể bất cẩn về các giả định. Rupert G. Miller's Beyond ANOVA (New York: Wiley, 1986 và sau đó tái bản) là một nguồn tốt về hậu quả và một chủ đề chính trong đó là bỏ qua các giả định độc lập là một trong những điều nguy hiểm nhất bạn có thể làm.
Nick Cox

1
@NickCox Chà, cô ấy không còn là sếp của tôi nữa, và tình huống cụ thể này là lý do chính tại sao. Về cơ bản, đó là đỉnh cao của rất nhiều suy nghĩ cẩu thả và quản lý dự án cẩu thả từ phía cô trong một môi trường nghiên cứu đàng hoàng. Điều đó sang một bên, cảm ơn cho lời giới thiệu cuốn sách. Từ âm thanh của nó, đó là một trong những điều tôi đang tìm kiếm để trích dẫn trong báo cáo cuối cùng của mình.
rwjones

Câu trả lời:


11

Tôi không biết bằng chứng nhưng tôi cá là điều này áp dụng khá chung chung. Một ví dụ là một thí nghiệm với 2 đối tượng trong mỗi 2 nhóm điều trị. Thử nghiệm Wilcoxon có thể có thể có ý nghĩa ở mức 0,05, nhưng thử nghiệm t có thể. Bạn có thể nói rằng sức mạnh của nó đến hơn một nửa từ các giả định của nó và không chỉ từ dữ liệu. Đối với vấn đề ban đầu của bạn, không phù hợp để tiến hành như thể các quan sát cho mỗi đối tượng là độc lập. Để tính đến mọi thứ sau khi thực tế chắc chắn không phải là thông lệ thống kê tốt ngoại trừ trong những trường hợp rất đặc biệt (ví dụ: công cụ ước tính cụm bánh sandwich).


2

Bạn có thể trích dẫn Định lý Không ăn trưa miễn phí nếu bạn muốn, nhưng bạn cũng có thể trích dẫn Modus Ponens (còn được gọi là Luật tách rời , cơ sở của lý luận suy diễn), đó là gốc rễ của Định lý Không ăn trưa miễn phí .

Các trưa Không miễn phí Định lý bao gồm một ý tưởng cụ thể hơn: một thực tế rằng không có thuật toán mà có thể phù hợp với mọi mục đích. Nói cách khác, Định lý Không ăn trưa miễn phí về cơ bản nói rằng không có viên đạn ma thuật thuật toán . Điều này bắt nguồn từ Modus Ponens, bởi vì đối với một thuật toán hoặc kiểm tra thống kê để đưa ra kết quả chính xác, bạn cần phải đáp ứng các tiền đề.

Giống như trong tất cả các định lý toán học, nếu bạn vi phạm các tiền đề, thì kiểm tra thống kê chỉ là vô nghĩa và bạn không thể rút ra bất kỳ sự thật nào từ nó. Vì vậy, nếu bạn muốn giải thích dữ liệu của mình bằng thử nghiệm của mình, bạn phải cho rằng các yêu cầu bắt buộc được đáp ứng, nếu chúng không (và bạn biết điều đó), thì thử nghiệm của bạn đã sai.

Đó là bởi vì lý luận khoa học dựa trên suy luận: về cơ bản, bài kiểm tra / luật / định lý của bạn là một quy tắc hàm ý , nói rằng nếu bạn có tiền đề Athì bạn có thể kết luận B: A=>Bnhưng nếu bạn không có Athì bạn có thể có Bhoặc không B, và cả hai trường hợp đều đúng , đó là một trong những nguyên lý cơ bản của suy luận / suy luận logic (quy tắc Modus Ponens). Nói cách khác, nếu bạn vi phạm các tiền đề, kết quả không thành vấn đề và bạn không thể suy luận bất cứ điều gì .

Ghi nhớ bảng nhị phân hàm ý:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

Vì vậy, trong trường hợp của bạn, để đơn giản hóa, bạn có Dependent_Variables => ANOVA_correct. Bây giờ, nếu bạn sử dụng các biến độc lập, do đó Dependent_Variablesđược False, sau đó ngụ ý sẽ là đúng, kể từ khi Dependent_Variablesgiả định là vi phạm.

Tất nhiên điều này rất đơn giản và trong thực tế, xét nghiệm ANOVA của bạn vẫn có thể trả về kết quả hữu ích vì hầu như luôn có một mức độ độc lập giữa các biến phụ thuộc, nhưng điều này cho bạn ý tưởng tại sao bạn không thể dựa vào thử nghiệm mà không hoàn thành các giả định .

Tuy nhiên, bạn cũng có thể sử dụng các thử nghiệm mà bản gốc không hài lòng bằng cách giảm vấn đề của bạn: bằng cách nới lỏng rõ ràng ràng buộc độc lập, kết quả của bạn vẫn có thể có ý nghĩa, không được đảm bảo (vì sau đó kết quả của bạn áp dụng cho vấn đề giảm, không phải vấn đề đầy đủ, do đó bạn không thể dịch mọi kết quả trừ khi bạn có thể chứng minh rằng các ràng buộc bổ sung của vấn đề mới không ảnh hưởng đến bài kiểm tra của bạn và do đó kết quả của bạn).

Trong thực tế, điều này thường được sử dụng để mô hình hóa dữ liệu thực tế, bằng cách sử dụng Naive Bayes, bằng cách mô hình hóa các biến phụ thuộc (thay vì độc lập) bằng mô hình giả định các biến độc lập và đáng ngạc nhiên là nó hoạt động rất tốt và đôi khi tốt hơn so với kế toán mô hình cho phụ thuộc . Bạn cũng có thể quan tâm đến câu hỏi này về cách sử dụng ANOVA khi dữ liệu không đáp ứng chính xác tất cả các kỳ vọng .

Tóm lại: nếu bạn có ý định làm việc trên dữ liệu thực tế và mục tiêu của bạn không phải là chứng minh bất kỳ kết quả khoa học nào mà là tạo ra một hệ thống chỉ hoạt động (nghĩa là dịch vụ web hoặc bất kỳ ứng dụng thực tế nào), giả định độc lập (và có thể là các giả định khác) có thể thoải mái, nhưng nếu bạn đang cố gắng suy luận / chứng minh một số sự thật chung , thì bạn nên luôn luôn sử dụng các bài kiểm tra mà bạn có thể đảm bảo về mặt toán học (hoặc ít nhất là an toàn và có thể chứng minh) rằng bạn đáp ứng tất cả các tiền đề .


2
Nếu tôi hiểu chính xác đối số của bạn, bạn bắt đầu bằng cách nói rằng không có ứng dụng thống kê nào mà các giả định không được đáp ứng chính xác là hợp lệ. Nếu đúng, đây thực sự là một tin xấu. Hầu hết các sách kinh tế lượng (chỉ đưa ra một ví dụ) dành thời gian giải thích rằng đó là sai (tóm tắt một từ) và chi tiết chính xác tại sao. Tuy nhiên, bạn dường như thay đổi chiến thuật của mình ở giữa và những gì bạn đang ủng hộ thay vào đó là mờ nhạt. Bằng cách nào đó làm việc trên dữ liệu có thể là âm thanh ngay cả khi nó không hợp lệ về mặt logic. Do đó, tôi không thể thấy một dòng lời khuyên rõ ràng ở đây.
Nick Cox

Vấn đề là: nếu các tiền đề bị vi phạm, bạn không thể lấy kết quả của bài kiểm tra theo mệnh giá vì suy luận bị sai lệch. Tuy nhiên, bạn vẫn có thể dùng thử và nếu bạn đủ tự tin và đủ kinh nghiệm, bạn vẫn có thể nhận được một cái gì đó từ nó, nhưng chủ yếu là trên các triển khai thực tế trong đó thực tế bạn không quan tâm đến lý luận khoa học (bạn chỉ đang cố gắng làm mẫu dữ liệu cho một số mục tiêu thực tế, không cố gắng suy ra một số sự thật chung có căn cứ về thế giới). Vì vậy, câu trả lời của tôi không phải là "tóm tắt một từ", đó chỉ là trường hợp chung (sai) so với trường hợp cụ thể (có thể ổn).
rầm rộ

PS: Tuyên bố của tôi không chỉ liên quan đến các ứng dụng thống kê mà còn bất kỳ ứng dụng của bất kỳ định lý / quy tắc / kiểm tra logic hay toán học nào, điều này đúng với mọi lý do sử dụng suy luận và quy nạp. Nhưng tôi quan tâm đến các tài liệu tham khảo sách kinh tế lượng của bạn, các tài liệu tham khảo khác mà bạn cung cấp trong một nhận xét về câu hỏi của OP rất phù hợp.
rầm rộ

Cảm ơn bạn đã thêm nhận xét, nhưng tôi phải nói rằng tôi không thấy tuyên bố của bạn đặc biệt rõ ràng hoặc có cơ sở. Tôi không thể thấy rằng các nhà khoa học đang làm việc (tôi là một) sẽ nắm bắt sự khác biệt của bạn giữa phân tích dữ liệu cho lý luận khoa học và cho các mục tiêu thực tế. Tôi sẽ để nó ở đó ngoại trừ khen ngợi các sách giáo khoa như của Jeff Wooldridge vì các bài tiểu luận mở rộng có hiệu lực trong đó các giả định là rất quan trọng, không, và khu vực màu xám lớn ở giữa. amazon.com/Jeffrey-M.-Woldold/e/B001IGLWNY
Nick Cox

Cảm ơn bạn đã tham khảo. Tôi vừa tìm thấy một câu hỏi khác khi họ đề cập đến một bài báo giải thích tại sao các giả định độc lập ngây thơ vẫn có thể hoạt động trên dữ liệu với các biến phụ thuộc: "Bài báo dường như chứng minh rằng các vịnh (ngây thơ) không chỉ tốt khi các tính năng độc lập, mà cả khi phụ thuộc các tính năng của nhau là tương tự / đối lập giữa các tính năng " stats.stackexchange.com/a/23491/25538
gabious
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.