Tôi gặp một số khó khăn trong việc hiểu cách giải thích của 2 bài kiểm tra mẫu KS và nó khác với bài kiểm tra t thông thường giữa 2 nhóm.
Hãy nói rằng tôi có nam và nữ làm một số nhiệm vụ và tôi thu thập một số điểm từ nhiệm vụ đó. Mục tiêu cuối cùng của tôi là xác định xem nam và nữ có thực hiện khác nhau trong nhiệm vụ đó không
Vì vậy, một điều tôi có thể làm là chạy thử nghiệm giữa 2 nhóm. Một điều khác tôi có thể làm là tính toán ECDF cho nam và nữ, vẽ sơ đồ cho họ và tiến hành thử nghiệm 2 mẫu KS. Tôi sẽ nhận được một cái gì đó như thế này:
Kiểm tra KS
Giả thuyết khống cho bài kiểm tra KS là 2 bộ phân phối điểm liên tục đến từ cùng một dân số
Khi tiến hành kiểm tra KS, tôi nhận được: D = 0.18888, p-value = 0.04742
Đầu tiên, tôi muốn kiểm tra xem diễn giải của tôi về kết quả có đúng không. Ở đây, tôi sẽ bác bỏ giả thuyết khống và nói rằng phân phối điểm nam và nữ đến từ các quần thể khác nhau. Hay nói cách khác, sự phân bố điểm nam và nữ khác nhau.
Cụ thể hơn, nam giới có xác suất đạt được điểm thấp hơn trong nhiệm vụ này và đó là sự khác biệt giữa 2 giới tính khi tôi diễn giải từ cốt truyện
Kiểm tra T
Bây giờ tại bài kiểm tra sẽ kiểm tra sự khác biệt giữa nam và nữ có nghĩa trên biến số điểm.
Hãy hình dung trường hợp nam hiệu suất kém hơn nữ trong nhiệm vụ này. Trong trường hợp đó, phân phối điểm nam sẽ tập trung ở mức trung bình thấp, trong khi phân phối điểm nữ sẽ tập trung quanh mức trung bình cao. Kịch bản này sẽ phù hợp với cốt truyện ở trên, vì nam giới sẽ có xác suất đạt được điểm thấp hơn cao hơn
Nếu bài kiểm tra t có ý nghĩa, tôi sẽ kết luận rằng điểm trung bình của nữ, cao hơn đáng kể so với nam. Hoặc về mặt dân số, điểm số nữ được rút ra từ một dân số có ý nghĩa cao hơn dân số nam, nghe có vẻ rất giống với kết luận của KS rằng họ đến từ các quần thể khác nhau.
Có gì khác biệt?
Con đực thực hiện kém so với con cái. Vì vậy, lợi ích của việc sử dụng một thử nghiệm so với thử nghiệm khác là gì? Có kiến thức mới nào mà bạn có thể đạt được từ việc sử dụng bài kiểm tra KS không?
Theo cách tôi nhìn thấy, những con đực có phân bố tập trung quanh một giá trị trung bình thấp và con cái tập trung quanh một giá trị trung bình cao là nguyên nhân gây ra thử nghiệm t đáng kể. Nhưng với thực tế tương tự , nam giới sẽ có xác suất ghi điểm thấp hơn, điều này sẽ khiến cốt truyện giống như trên và đưa ra một bài kiểm tra đáng kể về KS. Vì vậy, kết quả của cả hai thử nghiệm đều có cùng một nguyên nhân cơ bản, nhưng có lẽ người ta có thể lập luận rằng xét nghiệm KS có tính đến nhiều hơn chỉ là phương tiện phân phối và cũng xem xét hình dạng của phân phối, nhưng có thể phân tích nguyên nhân của xét nghiệm KS đáng kể chỉ từ kết quả xét nghiệm?
Vì vậy, giá trị trong việc chạy thử nghiệm KS qua thử nghiệm là gì? Và giả sử rằng tôi có thể đáp ứng các giả định của bài kiểm tra t cho câu hỏi này