Tôi hiểu trực giác đằng sau MCP nhưng tôi gặp khó khăn trong việc xác định chính xác nguyên nhân, điều gì nên tránh hoặc ít nhất là chiếm.
Theo định nghĩa thẳng thắn nhất của nó, tôi đồng ý rằng nếu tôi lấy bất kỳ dữ liệu nào và áp dụng cách tiếp cận vũ phu để thử mọi giả thuyết khống có thể, cuối cùng tôi sẽ tìm thấy một dữ liệu có thể bị từ chối với alfa tùy ý (ví dụ: 5%) và tuyên bố một khám phá.
Nhưng trong nhiều định nghĩa về MCP, tôi đã đọc một cái gì đó như "bạn càng kiểm tra nhiều thì bạn càng có khả năng tìm thấy" và mặc dù tôi đồng ý, tôi không nhất thiết phải xem đó là một vấn đề (hoặc ít nhất là gốc rễ của vấn đề). Ví dụ, nếu nhiều nhà nghiên cứu đang phân tích cùng một hiện tượng với cùng một dữ liệu có sẵn, thì mỗi người thử nghiệm giả thuyết của riêng mình, nhiều khả năng người ta sẽ tìm thấy một khám phá (hơn là chỉ là một nhà nghiên cứu), điều đó có nghĩa là họ nên áp dụng một số loại hiệu chỉnh đối với alfa mục tiêu của họ (ví dụ: hiệu chỉnh Bonferroni )? Tôi cho rằng câu trả lời là không, nhưng sau đó không hiểu tại sao một nhà nghiên cứu duy nhất nên thử nghiệm nhiều giả thuyết (một lần nữa, đồng ý rằng hệ thống thử nghiệm có thể bị lạm dụng và cần phải điều chỉnh cho điều đó).
Khi nào cơ hội gia tăng này để tìm ra một khám phá (từ chối một giả thuyết khống) trở thành một vấn đề? Khi suy nghĩ về nguyên nhân, có một số yếu tố xuất hiện trong đầu, nhưng tôi không chắc một trong số chúng (hoặc những yếu tố khác không được liệt kê ở đây) có liên quan nhiều hơn đến nguyên nhân của vấn đề này:
Phân tích bài hoc : Tôi hiểu rằng các giả thuyết nên (tốt nhất) được hình thành một tiên nghiệm, nếu không, tôi chỉ nhìn vào dữ liệu cố gắng đoán xem giả thuyết nào tôi có thể phù hợp với alfa mong muốn.
Sử dụng lại dữ liệu: Vấn đề đã biến mất nếu tôi sử dụng các bộ dữ liệu khác nhau cho mỗi giả thuyết tôi kiểm tra? Cơ hội tìm thấy một khám phá vẫn sẽ tăng thêm nhiều giả thuyết mà tôi kiểm tra (ngay cả trên các tập dữ liệu khác nhau).
Các nhà nghiên cứu độc lập: sử dụng lại ví dụ trước, MCP có liên quan đến cùng một nhóm nghiên cứu / nỗ lực không? Hoặc nó áp dụng cho nhiều nhà nghiên cứu độc lập làm việc trên cùng một vấn đề (hoặc thậm chí trên cùng một dữ liệu hoặc tương tự)?
Các giả thuyết độc lập: liên quan đến vấn đề trước đó, liệu vấn đề có phát sinh (hoặc được biểu hiện mạnh mẽ hơn) khi các giả thuyết này độc lập? (vì tôi chiếm nhiều không gian tìm kiếm hơn) hoặc vấn đề chính là thử các giả thuyết tương tự với các biến thể nhỏ (ví dụ: tinh chỉnh một tham số)?
Tôi có thể tóm tắt các điểm ở trên, theo cách giải thích của tôi, vì (1) và (2) là các hình thức giảm không gian tìm kiếm (thuật ngữ mượn từ lý thuyết tối ưu hóa) trong đó tôi dễ dàng tìm thấy khám phá hơn; và (3) và (4) khi sử dụng các phương pháp tìm kiếm trực giao hơn bao trùm nhiều không gian tìm kiếm này mỗi khi chúng được áp dụng (nghĩa là mỗi khi một giả thuyết được kiểm tra). Nhưng đây chỉ là một số nguyên nhân có thể tôi có thể đưa ra, để giúp bắt đầu câu trả lời, tôi còn thiếu nhiều điều nữa.
Câu hỏi này phần nào được theo dõi từ câu hỏi trước đó hỏi tại sao nhiều vấn đề so sánh lại , đưa ra một vấn đề tương tự như sự khác biệt giữa FWER và FDR (nếu tôi hiểu chính xác câu hỏi). Trong câu hỏi này tôi không coi đó là một vấn đề (mặc dù tôi sẽ thiên về sử dụng FDR hơn), cả hai tỷ lệ đều ngụ ý rằng có một vấn đề khi phân tích nhiều hơn một giả thuyết (nhưng tôi không thấy sự khác biệt so với trường hợp khi Tôi phân tích các vấn đề không liên quan khác nhau, tìm ra một khám phá cho mỗi vấn đề với mức ý nghĩa 5%, điều đó có nghĩa là khi tôi "giải quyết" 100 vấn đề bác bỏ các giả thuyết khống, 5 trong số đó - có thể là sai - có thể sai). Các câu trả lời tốt nhất cho câu hỏi đó ngụ ý rằng không có câu trả lời chắc chắn cho câu hỏi đó và có lẽ cũng không có câu hỏi nào cho câu hỏi này, nhưng nó vẫn rất hữu ích (ít nhất là với tôi) để làm sáng tỏ càng nhiều càng tốt nguyên nhân gây ra lỗi MCP đến từ.
( Một câu trả lời khác cho cùng một câu hỏi gợi ý một bài viết giải thích lợi ích của phối cảnh mô hình đa cấp Bayes so với phối cảnh cổ điển. Đây là một cách tiếp cận thú vị khác đáng để nghiên cứu nhưng phạm vi của câu hỏi này là khung cổ điển.)
Đã có một số câu hỏi về vấn đề này, nhiều câu hỏi đáng đọc (ví dụ: 1 , 2 , 3 , 4 ) giải quyết (từ các quan điểm khác nhau) các vấn đề nêu trên, nhưng tôi vẫn cảm thấy một câu trả lời thống nhất hơn (nếu điều đó thậm chí có thể) thiếu, do đó, câu hỏi này, mà tôi hy vọng không làm giảm SNR (đã có vấn đề) .