Xếp hạng và biến đổi z thay vì Wilcoxon?


8

Andrew Gelman trong một bài đăng gần đây trên blog của mình đề nghị sử dụng thứ hạng, biến đổi thứ hạng thành điểm số z, sau đó sử dụng các công cụ và kiểm tra tham số thay vì thực hiện các bài kiểm tra không tham số. Tôi chưa bao giờ nghe nói về điều đó trước đây.

Một tìm kiếm trên Google đã chỉ cho tôi hàm R này trong gói GenABEL , có vẻ như thực hiện chuyển đổi thứ hạng + z của vectơ dữ liệu nhưng tôi không thể tìm thấy các bài báo đánh giá hoặc thảo luận về ý tưởng sử dụng các phép thử tham số trên dữ liệu được chuyển đổi xét nghiệm Wilcoxon.

Bất cứ ai có thể chỉ cho tôi một số tài liệu về phương pháp này?


2
Đây không phải là một bài kiểm tra tham số. Bạn vừa sử dụng một xấp xỉ tiệm cận của phân phối null của thống kê dựa trên xếp hạng.
DSaxton

1
@dsaxton Trong nhiều trường hợp, đây là một bài kiểm tra không tham số (hay nói đúng hơn là gần đúng với một). Việc thay thế các cấp bậc bằng bất kỳ tập hợp điểm cố định (đã cho kích thước mẫu) nào sẽ không làm thay đổi sự thiếu phụ thuộc vào các hình dạng phân phối ban đầu dưới giá trị null.
Glen_b -Reinstate Monica

Câu trả lời:


10

(Kéo Conover [1] khỏi giá sách ...)

Ý tưởng này khá cũ; nó bắt nguồn từ ít nhất là van der Waerden (1952/1953) [2] [3], người đã đề xuất một bài kiểm tra tương ứng với Kruskal Wallis nhưng với thứ hạng được thay thế bằng điểm số bình thường. (Ý tưởng sử dụng các giá trị bình thường ngẫu nhiên theo thứ tự thay vì xấp xỉ kỳ vọng của chúng hoặc trung vị của chúng - có lẽ thậm chí cũ hơn một chút.)

Theo Conover, Fisher và Yates (1957) [4] đề nghị thay thế các quan sát bằng điểm số bình thường dự kiến ​​(tức là các cấp bậc được chuyển đổi) trong một loạt các thử nghiệm trong đó tính quy phạm sẽ được giả định.

Hiệu suất tương đối không có triệu chứng ở mức bình thường sẽ là 1, điều này làm cho âm thanh khá hấp dẫn ... tuy nhiên, lợi thế hơn so với Wilcoxon-Mann-Whitney (tăng sức mạnh) - ngay cả ở mức bình thường - là khá nhỏ, và nếu phân phối có đuôi nặng hơn bình thường (nói logistic), có thể bất lợi khi làm điều này. (Một số mô phỏng cho thấy thực tế là như vậy: trừ khi phân phối gần với mức bình thường - trong trường hợp đó không có lợi ích gì khi thực hiện chuyển đổi - việc chuyển đổi như vậy thực sự có thể mất điện.)

Chernoff & Lehmann [5] tính toán sức mạnh tiệm cận cho nhiều loại phân phối; trong đó có ít nhất một cái đuôi rất ngắn (chẳng hạn như đồng phục), bài kiểm tra điểm số bình thường có thể tốt hơn nhiều cho một sự thay thế thay đổi so với Wilcoxon-Mann-Whitney - tốt hơn so với bài kiểm tra t. Kết quả của họ đồng ý với mô phỏng của tôi cho các trường hợp đuôi nặng hơn.

Lưu ý rằng trong trường hợp hai mẫu, khi sự phân tách về phương tiện trở nên lớn, trong khi mẫu kết hợp trông khá bình thường, hai mẫu không hoàn toàn bình thường:

nhập mô tả hình ảnh ở đây

Do đó, không phải tất cả các thuộc tính của bài kiểm tra bình thường sẽ chuyển sang bài kiểm tra điểm bình thường và hành vi ở các khoảng cách lớn hơn (với các mẫu nhỏ) có thể hơi phản cảm.

Các bài kiểm tra thu được từ ý tưởng này đôi khi được gọi chung là các bài kiểm tra điểm bình thường , thuật ngữ tìm kiếm (thông qua Google, nói) xuất hiện một số tài liệu tham khảo.

Ví dụ, ở đây , Richard Darlington thảo luận về việc thực hiện nó cho bài kiểm tra xếp hạng Wilcoxon đã ký; ông chỉ ra rằng có một lợi thế so với bài kiểm tra xếp hạng đơn giản, bởi vì nó làm giảm số lượng giá trị ràng buộc của thống kê kiểm tra.

Trước khi tôi kết thúc việc viết các trang trên đó, tôi sẽ để bạn tìm kiếm thêm.

Conover liệt kê một số tài liệu tham khảo khác và có một chút thảo luận, vì vậy tôi chắc chắn khuyên bạn nên đọc nó.

Tuy nhiên, quan điểm của Gelman dường như là về sự tiện lợi - không cần phải phát triển một thử nghiệm mới mỗi khi tình huống thay đổi; mặc dù nếu sự thuận tiện là vấn đề chính thì đã có khả năng sử dụng các phép thử hoán vị trên bất kỳ thống kê nào chúng ta thích. [Với cách tiếp cận điểm số bình thường, khó khăn là chúng ta vẫn cần một cách phù hợp để xếp hạng - bạn không thể chỉ xếp hạng những thứ không thể so sánh được dưới giá trị null và mong đợi loại hành vi phù hợp. Có một vấn đề tương tự với bài kiểm tra hoán vị, vì bạn cũng cần khả năng trao đổi theo null.

Bạn đề cập đến một chức năng R, nhưng bạn có thể xếp hạng và chuyển đổi thành điểm số bình thường một cách dễ dàng trong R chỉ bằng cách sử dụng các chức năng đi kèm với R.

ví dụ: sử dụng sleepdữ liệu trong R. bạn sẽ thực hiện kiểm tra theo cách này:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980), Số
liệu thống kê phi thực tế thực tế , 2e.
Wiley. trang 316.

(Từ liên kết Wikipedia ở trên, có vẻ như trong 3e (1999), cuộc thảo luận bắt đầu từ trang 39)

[2] van der Waerden, BL (1952),
"thứ tự kiểm tra đối với các vấn đề hai mẫu và quyền lực của họ",
Kỷ yếu của Tập đoàn Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453-458.

[3] van der Waerden, BL (1953),
"kiểm tra theo thứ tự cho các vấn đề hai mẫu. II, III",
Kỷ yếu của Tập đoàn Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311 con316.

(cũng có sửa chữa cho bài báo năm 1952 trên p 80 của tập đó)

[4]
Các bảng thống kê của Fisher RA và Yates F. (1957) cho nghiên cứu sinh học, nông nghiệp và y tế , 5e, Oliver & Boyd, Edinburgh.

[5] Hodges, JL; Lehmann, EL (1961),
"So sánh các điểm số bình thường và các bài kiểm tra Wilcoxon",
Kỷ yếu của Hội nghị chuyên đề Berkeley về thống kê và xác suất toán học lần thứ tư, Tập 1: Đóng góp cho lý thuyết thống kê , 307--317,
Nhà xuất bản Đại học California, Berkeley, California
http://projecteuclid.org/euclid.bsmsp/1200512171 .


Glen, đây là một chủ đề thú vị (mà tôi muốn tìm hiểu thêm) và một câu trả lời hay của bạn. Nhưng tôi có thể cầu xin bạn thêm một số xác thịt (diễn ngôn / kết luận) cho nó ngoài các liên kết không? Và, có thể, thu thập một số liên kết đến Q / A tương tự trên trang web này? Cảm ơn bạn.
ttnphns

Chủ đề tuyệt vời. Có bất kỳ so sánh táo nào được công bố so sánh về cách tiếp cận không theo tỷ lệ và cách tiếp cận điểm bình thường (với kiểm tra tham số) để kiểm tra sự khác biệt về phương tiện không? Đồng nghiệp của tôi và tôi có một số bài kiểm tra về mối tương quan, nhưng đó là tất cả những gì tôi biết. Trong bối cảnh tương quan, điểm số bình thường dẫn đến sức mạnh tốt hơn một chút so với bài kiểm tra xếp hạng (tương quan Spearman) hoặc bài kiểm tra tham số chưa được kiểm tra (Pearson). Tôi tò mò muốn biết nếu kết quả tương tự xảy ra trong các bối cảnh khác.
Anthony

1
@Antony. Mục [5] được chỉ ra bởi Glen, chứa một so sánh táo với điểm số bình thường và Wilcoxon dựa trên hiệu quả tiệm cận. Học giả liệt kê 114 trích dẫn cho bài báo đó, một số trong số họ nên cung cấp các hình thức so sánh khác.
Jacques Wainer

1
χ2,df=1

1
Xin lỗi cho tất cả các ý kiến, nhưng tôi không thể giữ lại một chủ đề thú vị như vậy! Thêm một suy nghĩ - con số của @ Glen_b chỉ ra một vấn đề được gọi là "thừa kế" của Zimmerman (2011). Ngay cả sau khi biến đổi, các mẫu riêng biệt có thể "kế thừa" một số thuộc tính của phân phối gốc, chưa được dịch. redalyc.org/articulo.oa?id=16917012005
Anthony
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.