Giá trị p cho phép thử tương quan của Pearson có thể được tính chỉ từ hệ số tương quan và cỡ mẫu không?


12

Bối cảnh: Tôi đã đọc một bài báo trong đó các tác giả báo cáo tương quan Pearson 0,754 từ cỡ mẫu 878. Kết quả giá trị p cho thử nghiệm tương quan là "hai sao" có ý nghĩa (ví dụ p <0,01). Tuy nhiên, tôi nghĩ rằng với kích thước mẫu lớn như vậy, giá trị p tương ứng phải nhỏ hơn 0,001 (nghĩa là ba sao đáng kể).

  • Giá trị p cho thử nghiệm này có thể được tính chỉ từ hệ số tương quan Pearson và cỡ mẫu không?
  • Nếu có, làm thế nào điều này có thể được thực hiện trong R?

1
Đối với những người quan tâm, đây là một máy tính giá trị p trực tuyến có r và n .
Jeromy Anglim

Câu trả lời:


13

Có, nó có thể được thực hiện, nếu bạn sử dụng phép biến đổi R-to-z của Fisher. Các phương thức khác (ví dụ bootstrap) có thể có một số lợi thế nhưng yêu cầu dữ liệu gốc. Trong R ( r là hệ số tương quan mẫu, n là số lượng quan sát):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Xem thêm bài viết này trên blog của tôi .

Điều đó nói rằng, cho dù đó là 0,01 hay 0,001 không quan trọng lắm. Như bạn đã nói, đây chủ yếu là một chức năng của kích thước mẫu và bạn đã biết rằng kích thước mẫu là lớn. Kết luận hợp lý là có lẽ bạn thậm chí không cần một bài kiểm tra nào (đặc biệt không phải là một bài kiểm tra giả thuyết được gọi là "không" rằng mối tương quan là 0). Với N = 878, bạn có thể khá tự tin vào độ chính xác của ước tính và tập trung vào việc diễn giải nó trực tiếp (tức là 0,75 lớn trong lĩnh vực của bạn?).

Tuy nhiên, chính thức, khi bạn thực hiện kiểm tra thống kê trong khung Neyman-Pearson, bạn cần xác định trước mức độ lỗi. Vì vậy, nếu kết quả của bài kiểm tra thực sự quan trọng và nghiên cứu được lên kế hoạch với 0,01 là ngưỡng, thì chỉ có ý nghĩa khi báo cáo p <.01 và bạn không nên tạo cơ hội cho p <.001 dựa trên kết quả thu được giá trị p . Kiểu linh hoạt không được tiết lộ này thậm chí là một trong những lý do chính đằng sau sự chỉ trích các ngôi sao nhỏ và nói chung hơn về cách thức kiểm tra ý nghĩa giả thuyết null được thực hiện trong khoa học xã hội.

Xem thêm Meehl, PE (1978). Rủi ro lý thuyết và dấu hoa thị dạng bảng: Ngài Karl, Ngài Ronald và sự tiến triển chậm của tâm lý mềm. Tạp chí tư vấn và tâm lý học lâm sàng, 46 (4), 806-834. (Tiêu đề chứa một tham chiếu đến những ngôi sao này, nhưng nội dung là một cuộc thảo luận rộng hơn về vai trò của kiểm tra ý nghĩa.)


1
Tôi có lẽ sẽ khuyên họ từ bỏ những ngôi sao nhỏ, ngay cả khi kết quả là chính xác nhưng tôi thấy quan điểm của bạn.
Gala

1
Tôi đã chỉnh sửa câu trả lời của mình để thêm nhận xét về vấn đề này. Lưu ý rằng 0,001 <0,01 vì vậy các tác giả chính thức là chính xác trong bất kỳ trường hợp nào, đó là vấn đề về cách kết quả được báo cáo ngụ ý. Tôi nghĩ rằng, không giống như một lỗi hoàn toàn mà một nhà phê bình tất nhiên phải sửa, vấn đề này nên để các tác giả quyết định.
Gala

1
Bạn nói đúng, nhưng cho đến nay tôi chưa bao giờ thấy báo cáo p <0,01 nếu p thực sự nhỏ hơn 0,001 (không nói rằng mức độ tin cậy cho bài viết là 0,01). Hơn nữa, trong bài báo mà tôi nói, các tác giả đã báo cáo 30 thử nghiệm tương quan dựa trên các cỡ mẫu từ 837 đến 886 với các mối tương quan từ 0.145 đến 0.754 và tất cả đều được báo cáo là hai sao đáng kể.
Miroslav Sabo

1
Tôi có một vấn đề khi đăng mã của mình ở đây, nhưng tôi chạy mô phỏng và giá trị p từ mã của bạn không giống với giá trị p từ cor.test.
Miroslav Sabo

4
Tôi đã viết bài đánh giá hướng dẫn về việc sử dụng Fisher's z cho các mối tương quan có thể truy cập tại stata-journal.com/sjpdf.html?articlenum=pr0041 Tôi khuyên bạn nên sử dụng nhiều hơn khoảng tin cậy và tính 0,724, 0,781 là giới hạn 95%. Tôi khuyên bạn nên nhìn vào dữ liệu nhiều hơn và thực hiện hồi quy.
Nick Cox

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.