Tại sao thử nghiệm Kolmogorov-Smirnov hoạt động?


25

Khi đọc về bài kiểm tra KS 2 mẫu, tôi hiểu chính xác những gì nó đang làm nhưng tôi không hiểu tại sao nó lại hoạt động .

Nói cách khác, tôi có thể làm theo tất cả các bước để tính toán các hàm phân phối theo kinh nghiệm, tìm sự khác biệt tối đa giữa hai để tìm thống kê D, tính các giá trị tới hạn, chuyển đổi thống kê D thành giá trị p, v.v.

Nhưng, tôi không biết tại sao bất kỳ điều này thực sự cho tôi biết bất cứ điều gì về hai bản phân phối.

Ai đó có thể dễ dàng nói với tôi rằng tôi cần nhảy qua một con lừa và đếm xem nó chạy nhanh như thế nào và nếu vận tốc nhỏ hơn 2 km / giờ thì tôi từ chối giả thuyết khống. Chắc chắn tôi có thể làm những gì bạn bảo tôi làm, nhưng những điều đó có liên quan gì đến giả thuyết không?

Tại sao xét nghiệm KS 2 mẫu hoạt động? Việc tính toán sự khác biệt tối đa giữa các ECDF có liên quan gì đến sự khác biệt của hai bản phân phối?

Bất kỳ trợ giúp được đánh giá cao. Tôi không phải là một nhà thống kê, vì vậy hãy cho rằng tôi là một thằng ngốc nếu có thể.


4
Chào mừng đến với CV, Darcy! Câu hỏi tuyệt vời!
Alexis

1
Nhảy qua một con lừa ... :)
Richard Hardy

Câu trả lời:


9

Về cơ bản, thử nghiệm này phù hợp là kết quả trực tiếp của định lý Glivenko Cantelli, một trong những kết quả quan trọng nhất của các quá trình thực nghiệm và có thể là thống kê.

n

Bao lâu? Mmyyeeaa tôi không biết. Sức mạnh của bài kiểm tra là loại đáng ngờ. Tôi sẽ không bao giờ sử dụng nó trong thực tế.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf


2
+1 Xin chào AdamO! Có một đến hai câu đảm nhận sức mạnh là "loại đáng ngờ?" Tôi rất thích quan điểm đó (tôi đã tập hợp rằng bài kiểm tra được coi là dễ dàng "áp đảo").
Alexis

1
F1F2p>0.05p<0.05F1=F2

1
F1F2

2
@Alexis không, tôi không có mối quan tâm với toán học của bài kiểm tra. Trên thực tế, tôi nghĩ nó khá thanh lịch và kết quả định lý giới hạn là rất ấn tượng.
AdamO

2
F1F2

9

Chúng tôi có hai mẫu độc lập, đơn biến:

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
GF
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
{Xi}i=1N{Yj}j=1MXiYjFGxFGF(x)G(x)xR


8

Một cách trực quan:

Thử nghiệm Kolmogorov - Smirnov chủ yếu dựa vào thứ tự quan sát theo phân phối. Logic là nếu hai bản phân phối cơ bản giống nhau, thì tùy thuộc vào kích thước mẫu, đơn đặt hàng sẽ được xáo trộn khá tốt giữa hai bản phân phối.

YXD

DXY

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.