Tôi có thể sử dụng Kolmogorov-Smirnov để so sánh hai bản phân phối theo kinh nghiệm không?


16

Bạn có thể sử dụng phép thử độ phù hợp Kolmogorov - Smirnov để so sánh hai phân phối theo kinh nghiệm để xác định xem chúng có xuất phát từ cùng một phân phối cơ bản không, thay vì so sánh một phân phối theo kinh nghiệm với phân phối tham chiếu được chỉ định trước?

Hãy để tôi thử hỏi cách này một cách khác. Tôi thu thập N mẫu từ một số phân phối tại một địa điểm. Tôi thu thập mẫu M tại một địa điểm khác. Dữ liệu là liên tục (mỗi mẫu là một số thực từ 0 đến 10, giả sử) nhưng không được phân phối bình thường. Tôi muốn kiểm tra xem tất cả các mẫu N + M này có đến từ cùng một phân phối cơ bản hay không. Có hợp lý không khi sử dụng thử nghiệm Kolmogorov-Smirnov cho mục đích này?

Cụ thể, tôi có thể tính toán phân phối theo kinh nghiệm từ các mẫu và phân phối theo kinh nghiệm từ các mẫuSau đó, tôi có thể tính toán thống kê kiểm tra Kolmogorov-Smirnov để đo khoảng cách giữa và : tức là tínhvà sử dụng D làm thống kê kiểm tra của tôi như trong bài kiểm tra Kolmogorov-Smirnov về mức độ phù hợp. Đây có phải là một cách tiếp cận hợp lý? NF0N M F 0 F 1 D = sup x | F 0 ( x ) - F 1 ( x ) | DF1MF0F1D=supx|F0(x)F1(x)|D

(Tôi đã đọc ở nơi khác rằng thử nghiệm Kolmogorov-Smirnov về mức độ phù hợp không có giá trị đối với các phân phối rời rạc , nhưng tôi thừa nhận tôi không hiểu điều này có nghĩa là gì hoặc tại sao nó có thể đúng. )

Hoặc, bạn có đề nghị một cái gì đó khác thay thế?


Tôi tự hỏi liệu, dựa trên nhận xét của @ Glen_b ở đây ( stats.stackexchange.com/questions/362/ mẹo ), người ta không nên sử dụng thử nghiệm KS để so sánh phân phối theo kinh nghiệm vì không nên sử dụng thử nghiệm KS khi ước tính tham số (? ).
russellpierce

Câu trả lời:


19

Đó là OK, và khá hợp lý. Nó được gọi là thử nghiệm Kolmogorov-Smirnov hai mẫu . Đo lường sự khác biệt giữa hai hàm phân phối bằng supnorm luôn hợp lý, nhưng để thực hiện một thử nghiệm chính thức, bạn muốn biết phân phối theo giả thuyết rằng hai mẫu là độc lập và mỗi iid từ cùng một phân phối cơ bản. Để dựa vào lý thuyết tiệm cận thông thường, bạn sẽ cần sự liên tục của phân phối chung cơ bản (không phải của các phân phối theo kinh nghiệm). Xem trang Wikipedia được liên kết ở trên để biết thêm chi tiết.

Trong R, bạn có thể sử dụng ks.test, tính toán giá trị chính xác cho các cỡ mẫu nhỏ. p


8
Trong R, bạn cũng có thể thực hiện kiểm tra KS đã được khởi động sekhon.ber siêu.edu/matching/ks.boot.html để thoát khỏi yêu cầu liên tục
Tiến sĩ G

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.