Tại sao hiệu quả tương đối tiệm cận của xét nghiệm Wilcoxon


13

Điều nổi tiếng là hiệu quả tương đối tiệm cận (IS) của bài kiểm tra xếp hạng có chữ ký của Wilcoxon là so với t- test của Student , nếu dữ liệu được rút ra từ dân số phân phối bình thường. Điều này đúng cho cả thử nghiệm một mẫu cơ bản và biến thể cho hai mẫu độc lập (Wilcoxon-Mann-Whitney U). Đây cũng là bài kiểm tra của Kruskal-Wallis so với ANOVA F -test, đối với dữ liệu thông thường.3π0.955

Liệu điều đáng chú ý này (đối với tôi, một trong những " sự xuất hiện bất ngờ nhất củaπ ") và kết quả đơn giản đáng chú ý có một bằng chứng sâu sắc, đáng chú ý hoặc đơn giản?


Với sự xuất hiện của π trong lũy bình thường, sự xuất hiện của π trong LÀ nên không thực sự được tất cả mà đáng ngạc nhiên. Tôi sẽ mạo hiểm một câu trả lời nhưng sẽ mất một thời gian để làm cho một câu trả lời tốt.
Glen_b -Reinstate Monica

1
@Glen_b Thật vậy - Tôi đã thấy một cuộc thảo luận "tại sao π xuất hiện rất nhiều trong thống kê" trước đây (mặc dù không thể nhớ nó có trên CV hay không) và "vì phân phối bình thường" Tôi biết rất nhiều, nhưng 3/π vẫn đáng ngạc nhiên khi lần đầu tiên bạn nhìn thấy nó. Để so sánh , IS của Mann-Whitney so với thử nghiệm t hai mẫu là 3 trên dữ liệu theo cấp số nhân, 1,5 trên số mũ đôi và 1 trên đồng phục - tròn hơn nhiều!
Cá bạc

1
@Silverfish Tôi đã liên kết trang 197 của van der Vaart "Thống kê tiệm cận". Đối với một mẫu, các kiểm tra ký hiệu có 2/π so với kiểm tra t.
Khashaa

1
@Silverfish ... và tại logistic đó là (π/3)2 . Có khá nhiều trong số các IS nổi tiếng (trong một hoặc hai trường hợp mẫu) liên quan đến π và một số ít là các tỷ số đơn giản của các số nguyên.
Glen_b -Reinstate Monica

1
Đối với bài kiểm tra xếp hạng một mẫu đã ký, dường như là . Đối với thử nghiệm dấu hiệu một mẫu, nó là 2 / π . Vì vậy, chúng tôi làm rõ vị trí của chúng tôi. Tôi nghĩ đó là một dấu hiệu tốt. 3/π2/π
Khashaa

Câu trả lời:


10

Phác thảo ngắn gọn về là dành cho một mẫu -test, kiểm tra chữ ký và kiểm tra chữ ký-rankt

Tôi hy vọng phiên bản dài của câu trả lời của @ Glen_b bao gồm phân tích chi tiết cho bài kiểm tra xếp hạng có chữ ký hai mẫu cùng với lời giải thích trực quan về IS. Vì vậy, tôi sẽ bỏ qua hầu hết các dẫn xuất. (trường hợp một mẫu, bạn có thể tìm thấy các chi tiết còn thiếu trong Lehmann TSH).

Kiểm tra vấn đề : Hãy là một mẫu ngẫu nhiên từ mô hình vị trí f ( x - θ ) , đối xứng về zero. Chúng ta phải tính toán LÀ kiểm tra ký, ký kiểm tra thứ hạng cho giả thuyết H 0 : θ = 0 tương ứng với t-test.X1,,Xnf(xθ)H0:θ=0

Để đánh giá hiệu quả tương đối của các thử nghiệm, chỉ các lựa chọn thay thế cục bộ được xem xét bởi vì các thử nghiệm nhất quán có sức mạnh có xu hướng 1 so với thay thế cố định. Lựa chọn thay thế địa phương làm phát sinh năng lượng tiệm cận không tầm thường thường có dạng chohcố định, được gọi làtrôi dạt Pitmantrong một số tài liệu.θn= =h/nh

Nhiệm vụ trước mắt của chúng tôi là

  • tìm phân phối giới hạn của từng thống kê kiểm tra theo null
  • tìm phân phối giới hạn của từng thống kê kiểm tra theo phương án
  • tính công suất tiệm cận cục bộ của từng xét nghiệm

Kiểm tra statisics và tiệm cận

  1. t-test (cho sự tồn tại của ) t n = σt n =
    tn= =nX¯σ^dN(0,1)dưới giá trị
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • nên kiểm tra mà từ chối nếu có chức năng điện tiệm cận 1 - Φ ( z α - h 1tn>zα
      1-Φ(zα-h1σ)
  2. ký kiểm tra Sn= =1nΣTôi= =1n1{XTôi>0}
    n(Sn12)dN(0,14)under the null 
    và có địa phương điện tiệm cận 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. kiểm tra ký-rank W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)dưới giá trị 
    và có địa phương điện tiệm cận 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Do đó, Một R E ( W n ) = (

ARE(Sn)=(2f(0)σ)2
Nếuflà mật độ chuẩn thông thường,ARE(Sn)=2/π,ARE(Wn)=3/π
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

Ghi chú về sự phát sinh của phân phối theo phương án

Tất nhiên có nhiều cách để rút ra phân phối giới hạn theo phương án. Một cách tiếp cận chung là sử dụng bổ đề thứ ba của Lê Cẩm. Phiên bản đơn giản hóa của nó

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 Tôi sẽ không đi sâu vào chi tiết này lắm (thực sự, với câu trả lời của bạn bao gồm mọi thứ khá độc đáo, tôi có lẽ sẽ không thêm bất cứ điều gì vào những gì tôi có bây giờ) vì vậy nếu bạn muốn nói chi tiết hơn, đừng ' t giữ lại tài khoản của tôi Tôi đã có được vài ngày (và vẫn còn ít hơn bạn đã có), vì vậy đó là một điều tốt bạn đã đến.
Glen_b -Reinstate Monica

Đây là một câu trả lời hay, đặc biệt khi thêm vào bổ đề của Le Cam (+1). Dường như với tôi có một bước nhảy lớn giữa việc thiết lập các tiệm cận trong 1, 2 và 3, và bit "do đó" nơi bạn viết các IS. Tôi nghĩ rằng nếu tôi viết nó lên, tôi sẽ xác định hiệu quả tiệm cận tại thời điểm này (hoặc có thể sớm hơn, vì vậy, kết quả của các điểm 1, 2 và 3 sẽ là các AE không chỉ là sức mạnh tiệm cận cục bộ trong từng trường hợp) và sau đó là bước để các IS sẽ dễ dàng hơn nhiều cho những người đọc tương lai theo dõi.
Cá bạc

H1

Vui lòng chỉnh sửa câu trả lời của tôi hoặc thêm nó vào OP.
Khashaa

1
@Khashaa Cảm ơn. Tôi sẽ chỉnh sửa bài viết của bạn khi tôi có những thứ phù hợp trước mặt tôi. Bạn có phiền làm rõ ý nghĩa của* trong phương trình cuối cùng?
Cá bạc

6

Điều này không có gì để giải thích tại sao πxuất hiện (được giải thích độc đáo bởi những người khác) nhưng có thể giúp bằng trực giác. Xét nghiệm Wilcoxon là mộtt-test trên hàng ngũ của Ytrong khi đó kiểm tra tham số được tính trên dữ liệu thô. Hiệu quả của xét nghiệm Wilcoxon đối vớit-test là bình phương tương quan giữa điểm số được sử dụng cho hai bài kiểm tra. Nhưn the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

Đây thực sự là một nhận xét rất hữu ích. Có hơi khái niệm gần hơn để làm n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(mà rõ ràng tạo ra kết quả tương tự)?
Cá bạc

(Dân hấp dẫn bởi lời nhận xét của Frank có thể muốn xem xét câu hỏi này về sự tương đương của Wilcoxon-Mann-Whitney U và một t -test vào hàng ngũ .)
cá bạc

Một điều tôi không hiểu về câu trả lời này là sự tương quan cao hơn đối với các giá trị thấp hơn củan (Tôi nghĩ lý do gần nhất là chúng ta không thấy đuôi rất tốt cho nhỏ hơn n). Rõ ràng là ngụ ý rằng hiệu quả tương đối của Wilcoxon cao hơn đối với nhỏn, điều làm tôi ngạc nhiên ... ?? (Tôi có thể thực hiện một số mô phỏng, nhưng (a) nếu có câu trả lời dễ dàng ... và (b) tôi có thiếu một điểm khái niệm nào đó không?)
Ben Bolker

Theo hồi ức của tôi, hiệu suất mẫu nhỏ của cả bài kiểm tra xếp hạng Wilcoxon đã ký và WMW thấp hơn một chút so với giá trị tiệm cận trên các lựa chọn thay thế ở phân phối chuẩn.
Glen_b -Reinstate Monica

5

Phiên bản ngắn: Lý do cơ bản với Wilcoxon-Mann-Whitney theo phương án thay đổi là vì việc tìm kiếm hiệu quả tương đối không triệu chứng (WMW / t) tương ứng với việc đánh giá 12σ2[f2(x)dx]2 Ở đâu f là mật độ phổ biến tại null và σ là phương sai phổ biến.

Vì vậy, bình thường, f2 thực sự là một phiên bản thu nhỏ của f; tích phân của nó sẽ có một1πkỳ hạn; khi bình phương, đó là nguồn gốc củaπ.

Thuật ngữ tương tự - với cùng một tích phân - có liên quan đến IS cho bài kiểm tra xếp hạng đã ký, do đó, nó có cùng giá trị.

Đối với kiểm tra dấu hiệu liên quan đến t, thì IS là 4σ2f(0)2... và f(0)2 lại có một π trong đó.

Vì vậy, về cơ bản, như tôi đã nói trong các bình luận; π là trong bài kiểm tra Wilcoxon-Mann-Whitney so với bài kiểm tra hai mẫu t, cho bài kiểm tra xếp hạng có chữ ký của Wilcoxon so với bài kiểm tra một mẫu và bài kiểm tra dấu hiệu so với bài kiểm tra một mẫu (trong mỗi trường hợp ở mức bình thường) hoàn toàn theo nghĩa đen bởi vì nó xuất hiện trong mật độ bình thường.

Tài liệu tham khảo:

JL Hodges và EL Lehmann (1956),
"Hiệu quả của một số đối thủ cạnh tranh không đối xứng của bài kiểm tra t",
Ann. Môn Toán. Thống kê. , 27 : 2, 324-335.


Tôi thích lời giải thích cho trực giác về sự xuất hiện của πtrong mẫu số; về cơ bản có phải là sự trùng hợp ngẫu nhiên khi entropy Renyi xuất hiện trong các tích phân WMW / Wilcoxon?
Cá bạc

@Silverfish Đó f2dxbật lên chắc chắn không phải là trùng hợp. Tuy nhiên, đó không phải vì đó là kết nối với entropy của Rényi, hoặc ít nhất là tôi không thấy bất kỳ kết nối trực tiếp nào. Mặc dù vậy, chúng ta đang đi vào những thứ mà tôi không thực sự biết về bây giờ.
Glen_b -Reinstate Monica

@Silverfish Nó chỉ là một entropy Renyi cho α= =2. Mặt khác, nó chỉ là một hình vuông cũ đơn giản có thể xuất hiện theo một triệu cách khác nhau.
abalter
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.