CDF hai mẫu của


9

Tôi đang cố gắng hiểu làm thế nào để đạt được giá trị p cho thử nghiệm Kolmogorov-Smirnov một phía và đang vật lộn để tìm CDF cho Dn1,n2+Dn1,n2 trong trường hợp hai mẫu. Dưới đây được trích dẫn ở một vài nơi là CDF cho Dn+ trong trường hợp một mẫu:

pn+(x)=P(Dn+x|H0)=xj=0n(1x)(nj)(jn+x)j1(1xjn)nj

Ngoài ra, whuber sez có một công thức hơi khác của CDF một mẫu này (Tôi thay thế cho trong trích dẫn của anh ấy để thống nhất với ký hiệu của tôi ở đây):xt

Sử dụng biến đổi tích phân xác suất, Donald Knuth lấy được phân phối (phổ biến) của chúng trên p. 57 và bài tập 17 của TAoCP Tập 2. Tôi xin trích dẫn:

(Dn+xn)=xnnckx(nk)(kx)k(x+nk)nk1

Điều này sẽ áp dụng cho các giả thuyết một phía trong trường hợp một mẫu, chẳng hạn như: H 0F(x)F00 , trong đó F(x) là CDF theo kinh nghiệm của xF0 là một số CDF.

Tôi nghĩ rằng các trong trường hợp này là giá trị của trong mẫu của một người, và rằng là số nguyên lớn nhất trong . (Có đúng không?)xDn+n(1x)nnx

Nhưng CDF cho (hoặc ) là gì khi một có hai mẫu? Ví dụ: khi H cho các CDF theo kinh nghiệm của và ? Làm cách nào để có được ?Dn1,n2+Dn1,n20FA(x)FB(x)0ABpn1,n2+


1
Giống như một con trỏ cho bất cứ ai nhìn vào trả lời câu hỏi này - câu trả lời của tôi cho câu hỏi trước đó của Alexis (được liên kết trong câu hỏi trên) có liên kết đến một số tài liệu tham khảo với một số thảo luận về lịch sử, mỗi tài liệu có một số tài liệu tham khảo có liên quan. Bạn có thể muốn kiểm tra các tài liệu đó và danh sách tài liệu tham khảo của họ.
Glen_b -Reinstate Monica

@Glen_b Cảm ơn bạn! Tôi thực sự đánh giá cao câu trả lời tuyệt vời của bạn cho câu hỏi khác của tôi và đã làm theo các tài nguyên được trích dẫn, nhưng tôi không có lực kéo nào đối với CDF cho ở đó, và thay vì bỏ qua các bình luận tôi nghĩ tôi sẽ chỉ mở một truy vấn mới . Tham khảo thêm chào mừng, nếu bạn biết bất kỳ sẽ làm việc cho điều này. D+
Alexis

Alexis: không có lời chỉ trích nào được dự định bởi bình luận của tôi; sự lựa chọn của bạn để mở một câu hỏi mới là hoàn toàn chính xác (theo ý kiến ​​của tôi). Tôi chỉ muốn tiết kiệm cho mọi người một chút công việc trong việc theo dõi một số tài liệu tham khảo có liên quan - tôi đoán rằng mọi người có thể không theo dõi liên kết của bạn đến câu hỏi khác và nó có thể không xảy ra với những người đã liên kết trong tôi câu trả lời có một số tài liệu tham khảo mà họ có thể muốn biết.
Glen_b -Reinstate Monica

Câu trả lời:


6

Ok, tôi sẽ có một đâm ở đây. Những hiểu biết quan trọng chào đón.

Trên trang 192 Gibbons và Chakraborti (1992), trích dẫn Hodges, 1958, bắt đầu với một CDF mẫu nhỏ (chính xác?) Cho thử nghiệm hai mặt (Tôi đang hoán đổi ký hiệu và cho và , tương ứng):m,ndn1,n2x

P(Dn1,n2x)=1P(Dn1,n2x)=1A(n1,n2)(n1+n2n1)

Trong đó được tạo ra thông qua việc liệt kê các đường dẫn (tăng đơn điệu trong và ) từ điểm gốc đến điểm thông qua một biểu đồ với thay thế cho giá trị của x -axis và y -axis là và . Ngoài ra, các đường dẫn phải tuân theo các ràng buộc của việc ở bên trong các ranh giới (trong đó là giá trị của thống kê kiểm tra Kolmogorov - Smirnov):A(n1,n2)n1n2(n1,n2)Sm(x)Fn1(x)n1F1(x)n2F2(x)x

n2n1±(n1+n2)x(n1+n2n1)

Dưới đây là hình ảnh của họ Hình 3.2 cung cấp một ví dụ cho , với 12 đường dẫn như vậy:A(3,4)

Hình 3.2 từ trang 193 của Gibbons và Chakraborti (1992) Suy luận thống kê không đối xứng.

Gibbons và Chakaborti tiếp tục nói rằng giá trị một phía có được bằng cách sử dụng cùng phương thức đồ họa này, nhưng chỉ với giới hạn dưới cho và chỉ phần trên cho .pDn1,n2+Dn1,n2

Những cách tiếp cận mẫu nhỏ này đòi hỏi các thuật toán liệt kê đường dẫn và / hoặc quan hệ lặp lại, chắc chắn sẽ thực hiện các tính toán tiệm cận mong muốn. Gibbons và Chakraborti cũng lưu ý các CDF giới hạn là và tiếp cận vô hạn, của :n1n2Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2x)=12i=1(1)i1e2i2x2

Và họ đưa ra CDF giới hạn của (hoặc ) là:Dn1,n2+Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2+x)=1e2x2

Vì và hoàn toàn không âm, CDF chỉ có thể lấy các giá trị khác không trên :D+D[0,)

CDF của $ D ^ {+} $ (hoặc $ D ^ {-} $)


Tài liệu tham khảo
Gibbons, JD và Chakraborti, S. (1992). Suy luận thống kê không đối xứng . Marcel Decker, Inc., phiên bản thứ 3, phiên bản sửa đổi và mở rộng.

Hodges, JL (1958). Xác suất quan trọng của thử nghiệm hai mẫu Smirnov. Arkiv for mHRatik . 3 (5): 469--486.


1
Cdf thực tế tồn tại ở mọi nơi, nhưng với thì cdf sẽ bằng 0; hình thức chức năng bạn đã cung cấp chỉ áp dụng cho (điều này phù hợp với lý do đơn giản; gì?(,0)x0P(D+<0)
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.