Kiểm tra Kolmogorovát Smirnov so với kiểm tra t

Tôi gặp một số khó khăn trong việc hiểu cách giải thích của 2 bài kiểm tra mẫu KS và nó khác với bài kiểm tra t thông thường giữa 2 nhóm.

Hãy nói rằng tôi có nam và nữ làm một số nhiệm vụ và tôi thu thập một số điểm từ nhiệm vụ đó. Mục tiêu cuối cùng của tôi là xác định xem nam và nữ có thực hiện khác nhau trong nhiệm vụ đó không

Vì vậy, một điều tôi có thể làm là chạy thử nghiệm giữa 2 nhóm. Một điều khác tôi có thể làm là tính toán ECDF cho nam và nữ, vẽ sơ đồ cho họ và tiến hành thử nghiệm 2 mẫu KS. Tôi sẽ nhận được một cái gì đó như thế này:

Kiểm tra KS

Giả thuyết khống cho bài kiểm tra KS là 2 bộ phân phối điểm liên tục đến từ cùng một dân số

Khi tiến hành kiểm tra KS, tôi nhận được: D = 0.18888, p-value = 0.04742

Đầu tiên, tôi muốn kiểm tra xem diễn giải của tôi về kết quả có đúng không. Ở đây, tôi sẽ bác bỏ giả thuyết khống và nói rằng phân phối điểm nam và nữ đến từ các quần thể khác nhau. Hay nói cách khác, sự phân bố điểm nam và nữ khác nhau.

Cụ thể hơn, nam giới có xác suất đạt được điểm thấp hơn trong nhiệm vụ này và đó là sự khác biệt giữa 2 giới tính khi tôi diễn giải từ cốt truyện

Kiểm tra T

Bây giờ tại bài kiểm tra sẽ kiểm tra sự khác biệt giữa nam và nữ có nghĩa trên biến số điểm.

Hãy hình dung trường hợp nam hiệu suất kém hơn nữ trong nhiệm vụ này. Trong trường hợp đó, phân phối điểm nam sẽ tập trung ở mức trung bình thấp, trong khi phân phối điểm nữ sẽ tập trung quanh mức trung bình cao. Kịch bản này sẽ phù hợp với cốt truyện ở trên, vì nam giới sẽ có xác suất đạt được điểm thấp hơn cao hơn

Nếu bài kiểm tra t có ý nghĩa, tôi sẽ kết luận rằng điểm trung bình của nữ, cao hơn đáng kể so với nam. Hoặc về mặt dân số, điểm số nữ được rút ra từ một dân số có ý nghĩa cao hơn dân số nam, nghe có vẻ rất giống với kết luận của KS rằng họ đến từ các quần thể khác nhau.

Có gì khác biệt?

Con đực thực hiện kém so với con cái. Vì vậy, lợi ích của việc sử dụng một thử nghiệm so với thử nghiệm khác là gì? Có kiến thức mới nào mà bạn có thể đạt được từ việc sử dụng bài kiểm tra KS không?

Theo cách tôi nhìn thấy, những con đực có phân bố tập trung quanh một giá trị trung bình thấp và con cái tập trung quanh một giá trị trung bình cao là nguyên nhân gây ra thử nghiệm t đáng kể. Nhưng với thực tế tương tự , nam giới sẽ có xác suất ghi điểm thấp hơn, điều này sẽ khiến cốt truyện giống như trên và đưa ra một bài kiểm tra đáng kể về KS. Vì vậy, kết quả của cả hai thử nghiệm đều có cùng một nguyên nhân cơ bản, nhưng có lẽ người ta có thể lập luận rằng xét nghiệm KS có tính đến nhiều hơn chỉ là phương tiện phân phối và cũng xem xét hình dạng của phân phối, nhưng có thể phân tích nguyên nhân của xét nghiệm KS đáng kể chỉ từ kết quả xét nghiệm?

Vì vậy, giá trị trong việc chạy thử nghiệm KS qua thử nghiệm là gì? Và giả sử rằng tôi có thể đáp ứng các giả định của bài kiểm tra t cho câu hỏi này

— Simon
nguồn

Kiểm tra t cổ điển kém hơn nhiều so với phân tích dữ liệu Bayes, hãy xem "Ước tính Bayes của John Kruschke thay thế cho kiểm tra t" indiana.edu/~kruschke/BEST/BEST.pdf

— Vladislavs Dovgalecs

Tôi không chắc cách kiểm tra KS liên quan đến các phương pháp Bayes ...?

— Simon

Chỉ cần ngừng sử dụng KS và kiểm tra t

— Vladislavs Dovgalecs

@xeon Nếu bạn định đưa ra những tuyên bố mạnh mẽ như vậy, bạn đã hỗ trợ họ tốt hơn. Lời khuyên của bạn sẽ không có ích gì trong việc chọn ra loại khác biệt trong ví dụ trong câu trả lời của tôi. Tại sao người ta nên từ bỏ một cách tiếp cận có tác dụng rõ ràng trong việc xác định sự khác biệt này trong các bản phân phối có lợi cho phương pháp không phù hợp?

— Glen_b -Reinstate Monica

@Glen_b Đó là lý do tại sao một bài viết bình luận, không phải là một câu trả lời. Có thể OP đã không đọc bài báo btw tuyệt vời đó; Tôi chỉ muốn đề nghị nó. Nhưng tôi đồng ý rằng tôi đã tuyên bố quá mạnh mẽ và cư xử hơi hợm hĩnh. Tôi xin lỗi vì đã hơi thô lỗ. Sẽ không xảy ra nữa.

— Vladislavs Dovgalecs

Như một ví dụ về lý do tại sao bạn muốn sử dụng hai bài kiểm tra Kolmogorov-Smirnov mẫu:

Tưởng tượng rằng dân số có nghĩa là tương tự nhưng phương sai rất khác nhau. Thử nghiệm Kolmogorov-Smirnov có thể nhận ra sự khác biệt này nhưng thử nghiệm t không thể.

Hoặc tưởng tượng rằng các bản phân phối có các phương tiện và sd tương tự nhưng con đực có phân phối lưỡng kim (màu đỏ) trong khi con cái (màu xanh) thì không:

Do nam và nữ thực hiện khác nhau? Có - con đực có xu hướng ghi điểm ở đâu đó khoảng 7,5-8 hoặc 12,5-13, trong khi con cái thường có xu hướng ghi điểm nhiều hơn ở giữa (gần 10 hoặc hơn) nhưng ít phân cụm về giá trị đó hơn hai giá trị con đực có xu hướng ghi điểm gần.

Vì vậy, Kolmogorov-Smirnov có thể tìm thấy các loại khác biệt chung hơn trong phân phối so với thử nghiệm t có thể.

— Glen_b -Reinstate Monica
nguồn

Ah, có ý nghĩa Tôi có thể mở rộng logic đó và nói rằng nếu thử nghiệm t có ý nghĩa, thì thử nghiệm KS cũng có thể có ý nghĩa, tuy nhiên đó có thể là do sự khác biệt trung bình và / hoặc bất kỳ sự khác biệt nào khác trong phân phối, do đó, giải thích về KS Kiểm tra khó? Vì vậy, một thử nghiệm KS chỉ thực sự hữu ích trong trường hợp không có sự khác biệt trung bình giữa 2 nhóm?

— Simon

Thử nghiệm t nhạy hơn với sự khác biệt về giá trị trung bình (đặc biệt nếu phân phối dân số gần với mức bình thường với độ lệch chuẩn tương tự). Bài kiểm tra KS có thể khó diễn giải hơn, nhưng tôi không đồng ý với câu cuối cùng của bạn. Bạn có thể có một sự khác biệt nhỏ về phương tiện đi kèm với sự khác biệt khác; kiểm tra t chỉ có sự khác biệt về phương tiện để thông báo cho nó, trong khi kiểm tra KS có thể được thông báo bằng các loại khác biệt. Tưởng tượng ví dụ trên, nhưng ở đó cũng có một sự thay đổi nhỏ về phương tiện; kiểm tra t có thể không nhận được sự khác biệt dễ dàng như kiểm tra KS.

— Glen_b -Reinstate Monica

@Glen_b: có đúng không khi nói rằng KS kiểm tra xem các bản phân phối có bằng nhau hay không trong khi kiểm tra t kiểm tra xem các bản phân phối có cùng ý nghĩa không?

@fcop Có và không; đưa ra các giả định và dưới giá trị null, phép thử t phương sai bình thường thực sự đang thử nghiệm để xác định danh tính của các bản phân phối - đó là tính tổng quát của phương án (kết hợp với các giả định) thực sự làm cho chúng khác biệt. Tất nhiên chúng ta có thể (và thường làm) sử dụng các thử nghiệm khi các giả định của chúng không hoàn toàn áp dụng và sau đó chúng ta sẽ xem xét hành vi của chúng dưới giá trị null và thay thế; kiểm tra t sẽ có xu hướng nhạy cảm với sự thay đổi về trung bình theo phương án, trong khi đó, KS có phần nhạy cảm với một nhóm các lựa chọn thay thế rất rộng.

— Glen_b -Reinstate Monica