Khi nào giá trị p bị lừa?


14

Các điều kiện dữ liệu mà chúng ta nên đề phòng, trong đó giá trị p có thể không phải là cách tốt nhất để quyết định ý nghĩa thống kê? Có loại vấn đề cụ thể rơi vào thể loại này?


2
Câu trả lời lén lút: hầu như luôn luôn. Có một sự khuyến khích rất lớn để tạo ra lỗi Loại 1 (nghĩa là "báo động sai") khi các nhà phân tích kiểm tra dữ liệu, vì vậy hầu như tất cả các giá trị p bạn sẽ gặp phải là "quá nhỏ".
thống kêRus

7
Chỉ cần ném nó ra khỏi đó, nhưng liệu loại câu hỏi này có tốt nhất được đặt ra trên Xác thực chéo không?
buruzaemon

1
@buruzaemon: Có thể. Tôi đã thực hiện một tìm kiếm, đây là trận đấu gần nhất: stats.stackexchange.com/questions/67320/NH Có vẻ như không có nhiều câu hỏi liên quan đến vấn đề này.
Alex I

Câu trả lời:


9

Bạn đang hỏi về việc nạo vét dữ liệu , đó là những gì xảy ra khi kiểm tra một số lượng lớn các giả thuyết đối với một tập dữ liệu hoặc kiểm tra các giả thuyết đối với một tập dữ liệu được đề xuất bởi cùng một dữ liệu.

Cụ thể, hãy kiểm tra nhiều nguy cơ giả thuyết và các giả thuyết Kiểm tra được đề xuất bởi dữ liệu .

Giải pháp là sử dụng một số loại hiệu chỉnh cho tỷ lệ phát hiện sai hoặc tỷ lệ lỗi Familywise , như phương pháp của Scheffé hoặc hiệu chỉnh Bonferroni (rất cũ) .

Theo một cách ít nghiêm ngặt hơn, có thể giúp lọc các khám phá của bạn theo khoảng tin cậy cho tỷ lệ chênh lệch (OR) cho mỗi kết quả thống kê. Nếu khoảng tin cậy 99% cho tỷ lệ chênh lệch là 10-12, thì OR là <= 1 với xác suất cực kỳ nhỏ, đặc biệt là nếu cỡ mẫu cũng lớn. Nếu bạn tìm thấy một cái gì đó như thế này, nó có thể là một hiệu ứng mạnh mẽ ngay cả khi nó được đưa ra từ một thử nghiệm của hàng triệu giả thuyết.


1
Trong khi Bonferroni chắc chắn là trường học cũ, nó vẫn còn khá phổ biến. Liên quan đến nó là một phương pháp gọi là hiệu chỉnh Šidák ( en.wikipedia.org/wiki/%C5%A0id%C3%A1k_correction ). Tôi đang gọi nó, bởi vì trong một hệ thống quảng cáo nhắm mục tiêu quy mô lớn, tôi đã làm việc trên chúng tôi có thể thực hiện phương pháp này như một UDF trong Hive. Tuy nhiên điều này chỉ hoạt động tốt hơn khi bạn có sự độc lập giữa các bài kiểm tra. Nếu không, bạn phải quay lại Bonferroni hoặc phương pháp khác.
Chris Simokat

5

Bạn không nên xem xét giá trị p trong bối cảnh.

Một điểm khá cơ bản (như được minh họa bởi xkcd ) là bạn cần xem xét có bao nhiêu bài kiểm tra bạn thực sự đang làm. Rõ ràng, bạn không nên sốc khi thấy p <0,05 cho một trong số 20 bài kiểm tra, ngay cả khi giả thuyết null là đúng mỗi lần.

Một ví dụ tinh tế hơn về điều này xảy ra trong vật lý năng lượng cao, và được gọi là hiệu ứng nhìn ở nơi khác . Không gian tham số bạn tìm kiếm tín hiệu có thể đại diện cho hạt mới càng lớn, bạn càng có khả năng nhìn thấy tín hiệu rõ ràng thực sự chỉ do dao động ngẫu nhiên.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.