Có thể thay đổi một giả thuyết để khớp với dữ liệu được quan sát (hay còn gọi là chuyến thám hiểm câu cá) và tránh sự gia tăng các lỗi Loại I?


32

Người ta biết rằng các nhà nghiên cứu nên dành thời gian quan sát và khám phá dữ liệu và nghiên cứu hiện có trước khi hình thành một giả thuyết và sau đó thu thập dữ liệu để kiểm tra giả thuyết đó (đề cập đến thử nghiệm ý nghĩa giả thuyết null). Nhiều sách thống kê cơ bản cảnh báo rằng các giả thuyết phải được hình thành một tiên nghiệm và không thể thay đổi sau khi thu thập dữ liệu nếu không phương pháp trở nên không hợp lệ.

Tôi hiểu rằng một lý do tại sao việc thay đổi một giả thuyết để phù hợp với dữ liệu quan sát là có vấn đề là do khả năng phạm lỗi loại I cao hơn do dữ liệu giả, nhưng câu hỏi của tôi là: đó là lý do duy nhất hoặc có vấn đề cơ bản nào khác xảy ra trong một chuyến thám hiểm câu cá?

Như một câu hỏi bổ sung, có cách nào để đi câu cá mà không phơi mình trước những cạm bẫy tiềm ẩn không? Ví dụ: nếu bạn có đủ dữ liệu, bạn có thể tạo ra các giả thuyết từ một nửa dữ liệu và sau đó sử dụng nửa còn lại để kiểm tra chúng không?

cập nhật

Tôi đánh giá cao sự quan tâm đến câu hỏi của tôi, nhưng câu trả lời và nhận xét chủ yếu nhắm vào những gì tôi nghĩ tôi đã thiết lập làm thông tin cơ bản. Tôi muốn biết liệu có lý do nào khác khiến nó xấu hơn khả năng kết quả giả cao hơn hay không và nếu có cách nào, chẳng hạn như chia dữ liệu trước, thay đổi một giả thuyết bài hoc nhưng tránh sự gia tăng lỗi Loại I.

Tôi đã cập nhật tiêu đề để hy vọng phản ánh lực đẩy của câu hỏi của tôi.

Cảm ơn, và xin lỗi vì sự nhầm lẫn!



1
Đưa ra một quan điểm khác về những gì đã được nói: Bản chất của phương pháp khoa học là đưa ra các giả thuyết và sau đó cố gắng làm sai lệch chúng để chúng có thể trở thành lý thuyết (nếu làm sai lệch). Đi thám hiểm câu cá là một cách hợp lệ để tìm ra những giả thuyết đáng để làm sai lệch trong một thử nghiệm sau này, nhưng bạn không bao giờ có thể thực hiện và cố gắng làm sai lệch một giả thuyết trong một lần. Cụ thể, nếu bạn cởi mở để điều chỉnh giả thuyết của mình, bạn sẽ không cố gắng làm sai lệch nó nữa. Thay vào đó, khi bạn điều chỉnh, bạn đang làm sai lệch giả thuyết chưa được điều chỉnh của mình và hình thành một giả thuyết mới.
Wrzlprmft

@jona, đó là một bài báo tuyệt vời. Tôi đã đọc các bài báo của cả Ioannidis và Schooler, nhưng Simmons et al minh họa tuyệt vời vấn đề.
hậu hoc

1
Tôi đang tự hỏi liệu bạn cũng sẽ tìm thấy bài viết này có liên quan đến câu hỏi của bạn không: stat.columbia.edu/~gelman/research/published/mult Môn2f.pdf . Nó không chính xác trong cùng một chủ đề, nhưng nó giải quyết một khía cạnh của nó.
a11msp

1
Dữ liệu có thể khiến bạn thay đổi giả thuyết của mình ... nhưng trong trường hợp đó, bạn cần bắt đầu thu thập dữ liệu mới từ đầu để xác nhận giả thuyết mới.
keshlam

Câu trả lời:


54

Chắc chắn bạn có thể đi thám hiểm câu cá, miễn là bạn thừa nhận rằng đó là một cuộc thám hiểm câu cá và đối xử với nó như vậy. Một cái tên đẹp hơn cho "phân tích dữ liệu thăm dò".

Một sự tương tự tốt hơn có thể là bắn vào một mục tiêu:

Bạn có thể bắn vào một mục tiêu và ăn mừng nếu bạn trúng mắt con bò đực.

Bạn có thể bắn mà không cần mục tiêu để kiểm tra các thuộc tính của súng.

Nhưng thật là gian lận khi bắn vào một bức tường và sau đó vẽ một mục tiêu xung quanh lỗ đạn.

Một cách để tránh một số vấn đề với điều này là thực hiện thăm dò trong tập dữ liệu huấn luyện và sau đó kiểm tra nó trên một tập dữ liệu "kiểm tra" riêng biệt.


13
Thật khó để cải thiện câu trả lời của Peter. Vấn đề đáng tiếc với việc nạo vét dữ liệu là các tác giả thiếu sự thừa nhận rằng các giả thuyết không được quy định đầy đủ, tức là không sử dụng thuật ngữ 'thăm dò'. Nhiều, nhiều nhà nghiên cứu đang nạo vét dữ liệu để có được một bài báo có thể xuất bản và không theo dõi bất kỳ nỗ lực xác nhận nào (điều này thường làm họ thất vọng).
Frank Harrell

2
Đưa nhận xét của Frank Harrell tiến thêm một bước: việc khám phá một số dữ liệu và xuất bản một phát hiện hấp dẫn ... là một phát hiện khám phá hấp dẫn, có thể được sao chép / xác thực. Nhược điểm là: nếu người khác xác nhận kết quả của bạn, họ cũng có thể có được vinh quang và nếu người khác không xác nhận kết quả của bạn, bạn đã bị lừa bởi một mối tương quan giả. Xấu nếu bạn có một cái tôi lớn. Chưa kể bạn sẽ cần công khai dữ liệu và thủ tục của mình, điều mà nhiều học viên trong nhiều lĩnh vực không làm được. Và bạn nên theo dõi với dữ liệu mới thay vì tiếp tục.
Wayne

11
+1But it's cheating to shoot at a wall and then paint a target around the bullet hole.
WernerCD

3
@ post-hoc tốt, nó không nên nhướng mày, nhưng nó có thể. Phụ thuộc vào đôi mắt của ai dưới lông mày!
Peter Flom - Tái lập Monica

2
Texas Sharpshooter Fallacy ..
smci

25

Vấn đề với các cuộc thám hiểm câu cá là thế này: nếu bạn kiểm tra đủ các giả thuyết, một trong số chúng sẽ được xác nhận với giá trị p thấp. Hãy để tôi đưa ra một ví dụ cụ thể.

Hãy tưởng tượng bạn đang làm một nghiên cứu dịch tễ học. Bạn đã tìm thấy 1000 bệnh nhân bị một tình trạng hiếm gặp. Bạn muốn biết những gì họ có điểm chung. Vì vậy, bạn bắt đầu thử nghiệm - bạn muốn xem liệu một đặc tính cụ thể có được thể hiện quá mức trong mẫu này hay không. Ban đầu bạn kiểm tra giới tính, chủng tộc, tiền sử gia đình thích hợp nhất định (cha chết vì bệnh tim trước 50 tuổi, nhưng cuối cùng, vì bạn gặp khó khăn trong việc tìm kiếm bất cứ thứ gì "dính", bạn bắt đầu thêm tất cả các loại yếu tố khác có thể liên quan đến bệnh:

  • là người ăn chay
  • đã đi du lịch đến Canada
  • học xong đại học
  • đã kết hôn
  • có con
  • có mèo
  • có chó
  • uống ít nhất 5 ly rượu vang đỏ mỗi tuần
    ...

Bây giờ đây là điều. Nếu tôi chọn đủ các giả thuyết "ngẫu nhiên", có thể bắt đầu có khả năng ít nhất một trong số đó sẽ dẫn đến giá trị ap nhỏ hơn 0,05 - bởi vì bản chất của giá trị p là "xác suất sai khi từ chối giả thuyết khống khi có không có tác dụng ". Đặt khác nhau - trung bình, cứ 20 giả thuyết không có thật bạn kiểm tra, một trong số chúng sẽ cho bạn ap <0,05 .

Đây là SO được tóm tắt rất tốt trong phim hoạt hình XKCD http://xkcd.com/882/ :

nhập mô tả hình ảnh ở đây

Bi kịch là ngay cả khi một tác giả riêng lẻ không thực hiện 20 thử nghiệm giả thuyết khác nhau trên một mẫu để tìm kiếm ý nghĩa, có thể có 19 tác giả khác làm điều tương tự; và người "tìm thấy" một mối tương quan bây giờ có một bài viết thú vị để viết, và một bài có khả năng được chấp nhận cho xuất bản

Điều này dẫn đến một xu hướng đáng tiếc cho những phát hiện không thể đưa ra. Cách tốt nhất để bảo vệ chống lại điều này với tư cách là một tác giả cá nhân là đặt thanh cao hơn. Thay vì kiểm tra các yếu tố riêng lẻ, hãy tự hỏi mình "nếu tôi kiểm tra N giả thuyết, xác suất để có ít nhất một dương tính giả là gì". Khi bạn đang thực sự thử nghiệm "giả thuyết câu cá", bạn có thể nghĩ đến việc thực hiện chỉnh sửa Bonferroni để bảo vệ chống lại điều này - nhưng mọi người thường không làm thế.

Có một số bài viết thú vị của Tiến sĩ Ioannides - được trích dẫn trên tờ Atlantic hàng tháng cụ thể về chủ đề này.

Xem thêm câu hỏi trước đó với một số câu trả lời sâu sắc.

cập nhật để trả lời tốt hơn cho tất cả các khía cạnh của câu hỏi của bạn:

Nếu bạn sợ bạn có thể "câu cá", nhưng bạn thực sự không biết giả thuyết nào sẽ được hình thành, bạn chắc chắn có thể chia dữ liệu của mình trong các phần "thăm dò", "sao chép" và "xác nhận". Về nguyên tắc, điều này sẽ hạn chế mức độ rủi ro của bạn đối với các rủi ro đã nêu trước đó: nếu bạn có giá trị ap 0,05 trong dữ liệu thăm dò và bạn nhận được một giá trị tương tự trong dữ liệu sao chép và xác nhận, thì nguy cơ bạn bị giảm sai. Một ví dụ hay về "làm đúng" đã được trình bày trên Tạp chí Y học Anh (một ấn phẩm rất được tôn trọng với Yếu tố Tác động của 17+)

Thăm dò và xác nhận các yếu tố liên quan đến mang thai không biến chứng ở phụ nữ không có thai: nghiên cứu đoàn hệ tương lai, Chappell et al

Đây là đoạn có liên quan:

Chúng tôi chia bộ dữ liệu của 5628 phụ nữ thành ba phần: bộ dữ liệu thăm dò của hai phần ba phụ nữ từ Úc và New Zealand, được chọn ngẫu nhiên (n = 2129); một bộ dữ liệu sao chép địa phương của một phần ba phụ nữ còn lại từ Úc và New Zealand (n = 1067); và một bộ dữ liệu xác nhận bên ngoài, khác biệt về địa lý của 2432 phụ nữ châu Âu từ Vương quốc Anh và Cộng hòa Ireland.

Quay trở lại một chút trong tài liệu, có một bài viết hay của Altman và cộng sự "Nghiên cứu tiên lượng và tiên lượng: xác nhận một mô hình tiên lượng" đi sâu hơn rất nhiều, và gợi ý những cách để đảm bảo bạn không rơi vào lỗi này. "Những điểm chính" từ bài viết:

Không nên sử dụng các mô hình không có giá trị trong thực hành lâm sàng Khi xác nhận mô hình tiên lượng, hiệu chuẩn và phân biệt đối xử nên được đánh giá Xác thực nên được thực hiện trên một dữ liệu khác với dữ liệu được sử dụng để phát triển mô hình, tốt nhất là từ bệnh nhân ở các trung tâm khác. do thiếu sót trong các phương pháp phát triển hoặc do mẫu mới quá khác so với ban đầu

Đặc biệt lưu ý đề xuất rằng việc xác thực được thực hiện (tôi diễn giải) với dữ liệu từ các nguồn khác - nghĩa là không đủ để phân chia dữ liệu của bạn một cách tùy ý thành các tập hợp con, nhưng bạn nên làm những gì bạn có thể để chứng minh rằng "học" trên một tập hợp từ một bộ các thí nghiệm có thể được áp dụng cho dữ liệu từ một tập hợp thí nghiệm khác. Đó là một thanh cao hơn, nhưng nó làm giảm thêm nguy cơ sai lệch hệ thống trong thiết lập của bạn tạo ra "kết quả" không thể được xác minh độc lập.

Đây là một chủ đề rất quan trọng - cảm ơn bạn đã đặt câu hỏi!


7
Điều này mang đến tâm trí: xkcd.com/882
Jens

2
@jens - đó là một lời giải thích hùng hồn hơn nhiều so với lời tôi đưa ra ... Cảm ơn vì liên kết đó. Như thường lệ - hãy di chuột qua phim hoạt hình cho một chút zinger.
Floris

Ioannides và bài báo Lehrer là con đường đưa tôi đến đây. Ví dụ của bạn tương tự như ví dụ trong Simmons et al được đề cập bởi @jona. Đó là một cách rất tốt để giải thích khả năng gia tăng lỗi Loại I, nhưng có lý do nào khác khiến nó xấu không?
hậu hoc

1
Vấn đề với việc nạo vét dữ liệu nói chung là bạn có nguy cơ nhầm lẫn giữa "mối tương quan" với "quan hệ nhân quả". Bằng cách đưa ra một giả thuyết hợp lý trước , sau đó xác nhận rằng nó giúp giải thích các quan sát, bạn hạn chế nguy cơ nhầm lẫn giữa hai điều này. "Dữ liệu lớn" thường đi theo một cách khác - phương thức hoạt động của họ là "nếu tôi phân tích đủ dữ liệu, tôi sẽ thấy các mô hình đúng trong quá khứ và điều đó sẽ tiếp tục giữ trong tương lai". Đôi khi nó hoạt động, đôi khi nó không. Thống kê không bao giờ nên trở thành một thay thế cho suy nghĩ và hiểu biết - chỉ bao giờ xác nhận .
Floris

6
Tôi không nghĩ rằng vấn đề chính là mối tương quan và mối quan hệ nhân quả. Thật dễ dàng để làm phân tích tương quan tệ hại chỉ để thấy rằng các hiệp hội không nhân rộng.
Frank Harrell

5

Câu hỏi đặt ra nếu có những vấn đề khác ngoài lạm phát loại I xảy ra với các chuyến thám hiểm câu cá.

0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.