Khi nào thì biến đổi z của Fisher thích hợp?


13

Tôi muốn kiểm tra một mối tương quan mẫu cho ý nghĩa, sử dụng giá trị p, đó làr

H0:ρ= =0,H1:ρ0.

Tôi đã hiểu rằng tôi có thể sử dụng biến đổi z của Fisher để tính toán điều này bằng cách

zobS= =n-32ln(1+r1-r)

và tìm giá trị p bằng

p= =2P(Z>zobS)

sử dụng phân phối chuẩn thông thường.

Câu hỏi của tôi là: lớn như thế nào để điều này trở thành một sự chuyển đổi thích hợp? Rõ ràng, phải lớn hơn 3. Sách giáo khoa của tôi không đề cập đến bất kỳ hạn chế nào, nhưng trên slide 29 của bản trình bày này, nó nói rằng phải lớn hơn 10. Đối với dữ liệu tôi sẽ xem xét, tôi sẽ có một cái gì đó như .nnn5 n 10n5n10


2
Các trang Wikipedia liệt kê các sai số chuẩn của mà được cho bởi nơi là kích thước mẫu. Vì vậy, bạn sẽ cần ít nhất 4 cặp hoàn chỉnh. Tôi không nhận thấy bất kỳ hạn chế nào ngoài kích thước mẫu. 1 / zobS N1/N-3N
COOLSerdash

8
Không chắc chắn bao nhiêu để tin tưởng một bài thuyết trình từ một người không thể đánh vần tên trường đại học của họ. Nghiêm trọng hơn, hãy cẩn thận với tất cả các lời khuyên ngụ ý rằng mọi thứ đều ổn trên một cỡ mẫu nhất định và nếu không thì rất tệ. Đó là vấn đề chất lượng gần đúng tăng lên một cách trơn tru với kích thước mẫu và cũng tùy thuộc vào sự phân phối dữ liệu. Lời khuyên đơn giản là hãy hết sức thận trọng, vạch ra mọi thứ và kiểm tra chéo với các khoảng tin cậy đã được khởi động.
Nick Cox

1
Slide 17 mô tả thử nghiệm t cho trường hợp đặc biệt . ρ= =0
whuber

Câu trả lời:


8

Đối với những câu hỏi như thế này, tôi sẽ chỉ chạy một mô phỏng và xem liệu giá trị hoạt động như tôi mong đợi không. Giá trị là xác suất vẽ ngẫu nhiên một mẫu làm lệch ít nhất nhiều so với giả thuyết null như dữ liệu bạn quan sát thấy nếu giả thuyết null là đúng. Vì vậy, nếu chúng ta có nhiều mẫu như vậy và một trong số chúng có giá trị là 0,04 thì chúng ta sẽ mong đợi 4% các mẫu đó có giá trị nhỏ hơn 0,04. Điều này cũng đúng với tất cả các giá trị có thể khác .p p ppppp

Dưới đây là một mô phỏng trong Stata. Các biểu đồ kiểm tra xem giá trị đo được cái mà chúng cần đo hay không, nghĩa là chúng cho thấy tỷ lệ mẫu có giá trị nhỏ hơn giá trị danh nghĩa lệch so với giá trị danh nghĩa . Như bạn có thể thấy rằng bài kiểm tra có chút vấn đề với số lượng quan sát nhỏ như vậy. Có hay không quá khó khăn cho nghiên cứu của bạn là lời kêu gọi phán xét của bạn.p p ppppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

nhập mô tả hình ảnh ở đây

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

nhập mô tả hình ảnh ở đây


1
Hãy thử trừ 2,5 thay vì 3 từ :-). n
whuber

5

FWIW Tôi thấy đề xuất trong Myers & Well (thiết kế nghiên cứu và phân tích thống kê, ấn bản thứ hai, 2003, trang 492). Các chú thích nêu:N10

Nói một cách chính xác, phép biến đổi bị sai lệch bởi một lượng : xem Pearson và Hartley (1954, trang 29). Độ lệch này thường không đáng kể trừ khi nhỏ và lớn và chúng tôi bỏ qua nó ở đây.r / ( 2 ( N - 1 ) ) N ρZr/(2(N-1))Nρ


3
Điều này có vẻ như nó là một câu trả lời cho tôi.
gung - Phục hồi Monica

1

Không chắc chắn liệu biến đổi của Fisher có phù hợp ở đây không. Đối với (NB: giả thuyết null dành cho dân số , không phải mẫu ), phân phối lấy mẫu của hệ số tương quan đã đối xứng, do đó không cần phải giảm độ lệch, đó là điều của Fisher nhắm đến, và bạn có thể sử dụng xấp xỉ của Sinh viên .H 0 : ρ = 0 ρ r z tzH0:ρ= =0ρrzt

Giả sử bạn có nghĩa là , thì độ lệch của tệp PDF đó sẽ phụ thuộc vào giá trị được đề xuất của , do đó sẽ không có câu trả lời chung nào về mức độ lớn của . Ngoài ra, giá trị tối thiểu của sẽ phụ thuộc vào mức ý nghĩa mà bạn đang làm việc. Bạn đã không nói rõ giá trị của nó.ρ 0 n n αH0:ρ= =ρ00ρ0nnα

Quan điểm của Nick là một công bằng: các xấp xỉ và khuyến nghị luôn luôn hoạt động trong một số khu vực màu xám.

Nếu, sau đó, xấp xỉ Fisher của bạn đủ tốt (= đối xứng), tôi sẽ sử dụng ràng buộc áp dụng cho phân phối , trong đó là tiêu chuẩn mẫu sai lệch. Nếu nó đủ gần với tính quy tắc, điều này trở thành . t s n ( 1.96 s / ϵ ) 2n(tα/2S/ε)2tSn(1,96S/ε)2


4
zzz

1
zH0:ρ= =ρ00t

3
ztρ= =0

1
z

εn
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.