(Kéo Conover [1] khỏi giá sách ...)
Ý tưởng này khá cũ; nó bắt nguồn từ ít nhất là van der Waerden (1952/1953) [2] [3], người đã đề xuất một bài kiểm tra tương ứng với Kruskal Wallis nhưng với thứ hạng được thay thế bằng điểm số bình thường. (Ý tưởng sử dụng các giá trị bình thường ngẫu nhiên theo thứ tự thay vì xấp xỉ kỳ vọng của chúng hoặc trung vị của chúng - có lẽ thậm chí cũ hơn một chút.)
Theo Conover, Fisher và Yates (1957) [4] đề nghị thay thế các quan sát bằng điểm số bình thường dự kiến (tức là các cấp bậc được chuyển đổi) trong một loạt các thử nghiệm trong đó tính quy phạm sẽ được giả định.
Hiệu suất tương đối không có triệu chứng ở mức bình thường sẽ là 1, điều này làm cho âm thanh khá hấp dẫn ... tuy nhiên, lợi thế hơn so với Wilcoxon-Mann-Whitney (tăng sức mạnh) - ngay cả ở mức bình thường - là khá nhỏ, và nếu phân phối có đuôi nặng hơn bình thường (nói logistic), có thể bất lợi khi làm điều này. (Một số mô phỏng cho thấy thực tế là như vậy: trừ khi phân phối gần với mức bình thường - trong trường hợp đó không có lợi ích gì khi thực hiện chuyển đổi - việc chuyển đổi như vậy thực sự có thể mất điện.)
Chernoff & Lehmann [5] tính toán sức mạnh tiệm cận cho nhiều loại phân phối; trong đó có ít nhất một cái đuôi rất ngắn (chẳng hạn như đồng phục), bài kiểm tra điểm số bình thường có thể tốt hơn nhiều cho một sự thay thế thay đổi so với Wilcoxon-Mann-Whitney - tốt hơn so với bài kiểm tra t. Kết quả của họ đồng ý với mô phỏng của tôi cho các trường hợp đuôi nặng hơn.
Lưu ý rằng trong trường hợp hai mẫu, khi sự phân tách về phương tiện trở nên lớn, trong khi mẫu kết hợp trông khá bình thường, hai mẫu không hoàn toàn bình thường:
Do đó, không phải tất cả các thuộc tính của bài kiểm tra bình thường sẽ chuyển sang bài kiểm tra điểm bình thường và hành vi ở các khoảng cách lớn hơn (với các mẫu nhỏ) có thể hơi phản cảm.
Các bài kiểm tra thu được từ ý tưởng này đôi khi được gọi chung là các bài kiểm tra điểm bình thường , thuật ngữ tìm kiếm (thông qua Google, nói) xuất hiện một số tài liệu tham khảo.
Ví dụ, ở đây , Richard Darlington thảo luận về việc thực hiện nó cho bài kiểm tra xếp hạng Wilcoxon đã ký; ông chỉ ra rằng có một lợi thế so với bài kiểm tra xếp hạng đơn giản, bởi vì nó làm giảm số lượng giá trị ràng buộc của thống kê kiểm tra.
Trước khi tôi kết thúc việc viết các trang trên đó, tôi sẽ để bạn tìm kiếm thêm.
Conover liệt kê một số tài liệu tham khảo khác và có một chút thảo luận, vì vậy tôi chắc chắn khuyên bạn nên đọc nó.
Tuy nhiên, quan điểm của Gelman dường như là về sự tiện lợi - không cần phải phát triển một thử nghiệm mới mỗi khi tình huống thay đổi; mặc dù nếu sự thuận tiện là vấn đề chính thì đã có khả năng sử dụng các phép thử hoán vị trên bất kỳ thống kê nào chúng ta thích. [Với cách tiếp cận điểm số bình thường, khó khăn là chúng ta vẫn cần một cách phù hợp để xếp hạng - bạn không thể chỉ xếp hạng những thứ không thể so sánh được dưới giá trị null và mong đợi loại hành vi phù hợp. Có một vấn đề tương tự với bài kiểm tra hoán vị, vì bạn cũng cần khả năng trao đổi theo null.
Bạn đề cập đến một chức năng R, nhưng bạn có thể xếp hạng và chuyển đổi thành điểm số bình thường một cách dễ dàng trong R chỉ bằng cách sử dụng các chức năng đi kèm với R.
ví dụ: sử dụng sleep
dữ liệu trong R. bạn sẽ thực hiện kiểm tra theo cách này:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980), Số
liệu thống kê phi thực tế thực tế , 2e.
Wiley. trang 316.
(Từ liên kết Wikipedia ở trên, có vẻ như trong 3e (1999), cuộc thảo luận bắt đầu từ trang 39)
[2] van der Waerden, BL (1952),
"thứ tự kiểm tra đối với các vấn đề hai mẫu và quyền lực của họ",
Kỷ yếu của Tập đoàn Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453-458.
[3] van der Waerden, BL (1953),
"kiểm tra theo thứ tự cho các vấn đề hai mẫu. II, III",
Kỷ yếu của Tập đoàn Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311 con316.
(cũng có sửa chữa cho bài báo năm 1952 trên p 80 của tập đó)
[4]
Các bảng thống kê của Fisher RA và Yates F. (1957) cho nghiên cứu sinh học, nông nghiệp và y tế , 5e, Oliver & Boyd, Edinburgh.
[5] Hodges, JL; Lehmann, EL (1961),
"So sánh các điểm số bình thường và các bài kiểm tra Wilcoxon",
Kỷ yếu của Hội nghị chuyên đề Berkeley về thống kê và xác suất toán học lần thứ tư, Tập 1: Đóng góp cho lý thuyết thống kê , 307--317,
Nhà xuất bản Đại học California, Berkeley, California
http://projecteuclid.org/euclid.bsmsp/1200512171 .