Xét nghiệm hoán vị hai mẫu Kolmogorov-Smirnov


8

Mặc dù sử dụng thử nghiệm loại Pearson chi-vuông / Cressie-Read dễ dàng hơn, tôi muốn kiểm tra sự bằng nhau của tỷ lệ trong các loại trên hai nhóm bằng cách sử dụng thử nghiệm loại Kolmogorov-Smirnov của mẫu được đề xuất bởi Pettitt & Stephens (1977 ) (xem thêm tại đây ).k

Cụ thể như các tác giả của bài báo đó chỉ ra, nó có thể có một số sức mạnh chống lại các xu hướng thay thế. Vì vậy, bài kiểm tra Kolmogorov-Smirnov danh nghĩa / phân loại một mẫu của họ có dạng: trong đó là hoán vị thứ tự của các loại, là tần số được quan sát và dự kiến ​​(hoặc tương đương, tỷ lệ quan sát) trong loại . Điều này có thể được viết tương đương như: Tôi muốn mở rộng điều này thành trường hợp hai mẫu sử dụng thủ tục ngẫu nhiên / hoán vị, chẳng hạn:

Dn=supπsup1jk|i=1j(fexp,π(i)fobs,π(i))|
πf.,ii
Dn=12i=1k|fexp,ifobs,i|
Dn(r)=12i=1k|fgroup1,i(r)fgroup2,i(r)|,r=1,,R
trong đó .(r) biểu thị một thống kê được tính dựa trên hoán vị rth của biến phân loại. Từ chối nếu giá trị của thống kê ban đầu lớn hơn giá trị 95% của thống kê được cho phép.

Bất kỳ ý kiến ​​nào về ưu / nhược điểm / hiệu lực của thủ tục như vậy đều rất đáng hoan nghênh. Cảm ơn.

Câu trả lời:


3

Câu trả lời phụ thuộc vào bản chất của quá trình tạo dữ liệu và vào giả thuyết thay thế mà bạn có trong đầu.

Bài kiểm tra của bạn là một loại hình vuông không trọng số. Do thiếu trọng số này, những thay đổi chủ yếu ảnh hưởng đến các danh mục ít dân cư sẽ khó phát hiện. Ví dụ, thử nghiệm của bạn sẽ là nhiều ít mạnh mẽ hơn so với kiểm định chi bình phương cho một sự thay đổi đồng phục tại địa điểm, mà được phát hiện chủ yếu bởi nhận thấy rằng hầu như tất cả các xác suất trong một đuôi được chuyển thành đuôi khác.

Ví dụ: giả sử các danh mục của bạn là phạm vi số nguyên được lập chỉ mục bởi và bạn đang quan sát các biến thiên bình thường của phương sai đơn vị nhưng không xác định được. 100 quan sát về một phương sai bình thường tiêu chuẩn, giả sử, sẽ chủ yếu chiếm các loại đến , mặc dù bạn có thể mong đợi một số ít chiếm các loại và . Ngay cả đối với sự thay đổi lớn của lỗi tiêu chuẩn ( nghĩa là thay đổi trung bình ), sức mạnh của bài kiểm tra giống như KD của bạn chỉ khoảng 50% (khi ).[i,i+1)i213255/100=0.5α=0.05

Thật khó để hình dung ra một thiết lập trong đó thử nghiệm này sẽ mạnh hơn thử nghiệm chi bình phương. Nếu bạn nghĩ rằng bạn đang ở trong một tình huống như vậy, hãy thực hiện một số mô phỏng để tìm ra sức mạnh là gì và nó so sánh với các thử nghiệm thay thế tiêu chuẩn như thế nào.


nếu tôi hiểu chính xác những gì bạn đã viết, thì có giống nhau cho tất cả không? Ngoài ra - tôi có thể xem làm thế nào để có được giá trị tới hạn ước tính của monte-carlo cho ; nhưng còn về thì sao? Dn(r)rDnDn(r)
ronaf

@ronaf Bạn có thể cung cấp thêm chi tiết về không? R là gì? Tôi không thấy rằng hoán vị các danh mục làm bất cứ điều gì cả: lưu ý rằng không có hoán vị sẽ thay đổi tổng số khác biệt tuyệt đối của số lượng của chúng. Dn(r)
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.