Bạn có thể sử dụng phép thử độ phù hợp Kolmogorov - Smirnov để so sánh hai phân phối theo kinh nghiệm để xác định xem chúng có xuất phát từ cùng một phân phối cơ bản không, thay vì so sánh một phân phối theo kinh nghiệm với phân phối tham chiếu được chỉ định trước?
Hãy để tôi thử hỏi cách này một cách khác. Tôi thu thập N mẫu từ một số phân phối tại một địa điểm. Tôi thu thập mẫu M tại một địa điểm khác. Dữ liệu là liên tục (mỗi mẫu là một số thực từ 0 đến 10, giả sử) nhưng không được phân phối bình thường. Tôi muốn kiểm tra xem tất cả các mẫu N + M này có đến từ cùng một phân phối cơ bản hay không. Có hợp lý không khi sử dụng thử nghiệm Kolmogorov-Smirnov cho mục đích này?
Cụ thể, tôi có thể tính toán phân phối theo kinh nghiệm từ các mẫu và phân phối theo kinh nghiệm từ các mẫuSau đó, tôi có thể tính toán thống kê kiểm tra Kolmogorov-Smirnov để đo khoảng cách giữa và : tức là tínhvà sử dụng D làm thống kê kiểm tra của tôi như trong bài kiểm tra Kolmogorov-Smirnov về mức độ phù hợp. Đây có phải là một cách tiếp cận hợp lý? N M F 0 F 1 D = sup x | F 0 ( x ) - F 1 ( x ) | D
(Tôi đã đọc ở nơi khác rằng thử nghiệm Kolmogorov-Smirnov về mức độ phù hợp không có giá trị đối với các phân phối rời rạc , nhưng tôi thừa nhận tôi không hiểu điều này có nghĩa là gì hoặc tại sao nó có thể đúng. )
Hoặc, bạn có đề nghị một cái gì đó khác thay thế?