Các mối quan hệ không nên có mặt trong các thử nghiệm Kolmgorov-Smirnov một mẫu trong R


12

Tôi sẽ sử dụng thử nghiệm Kolmogorov-Smirnov để kiểm tra tính quy phạm của MYDATA trong R. Đây là một ví dụ về những gì tôi làm

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

Đây là kết quả mà R mang lại cho tôi:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

Tôi nghĩ rằng có một vấn đề, "quan hệ" có nghĩa là gì trong cảnh báo này?


2
Tại sao bạn muốn thực hiện kiểm tra tính quy phạm này? Trong hầu hết các trường hợp, kiểm tra tính quy phạm của một biến là khá vô dụng , mặc dù kiểm tra tính quy tắc của phần dư sau hồi quy có thể quan trọng.
EdM

2
Ngay cả khi không có mối quan hệ, kiểm tra KS không phải là kiểm tra tính quy tắc chung mà là phân phối được chỉ định đầy đủ (bạn đang ước tính giá trị trung bình và sd từ dữ liệu). Giá trị p của bạn sẽ là vô nghĩa. Tìm kiếm trang web của chúng tôi để tham khảo bài kiểm tra Lilliefors
Glen_b -Reinstate Monica

Câu trả lời:


10

Bạn có hai vấn đề ở đây:

Kiểm tra KS là phân phối liên tục và vì vậy MYDATA không được chứa bất kỳ mối quan hệ nào (giá trị lặp lại).

Lý thuyết về kiểm tra KS không cho phép bạn ước tính các tham số của phân phối từ dữ liệu như bạn đã làm. Sự giúp đỡ cho ks.test giải thích điều này.


tại sao ks.testtrong trường hợp hai mẫu muốn loại bỏ các mối quan hệ khỏi cả hai xy? Ý tôi là, tôi không có mối quan hệ nào trong xy( unique(x)unique(y)), nhưng hai vectơ có một giá trị chung. Không nên xem xét các mối quan hệ chỉ trong số các giá trị trong xvà trong y?
Nemei

@Nemei nếu bạn có câu hỏi mới, vui lòng hỏi nó bằng cách sử dụng nút Hỏi Câu hỏi.
mdewey

Tôi mặc dù điều này không đủ để trở thành một câu hỏi khác, nhưng đây là: stats.stackexchange.com/questions/389151/ Kẻ
Nemei

5

Theo giải thích của @mdewey, Thử nghiệm KS không phù hợp khi ước tính các tham số từ dữ liệu. Bạn có thể sử dụng mã sau đây, dựa trên bài kiểm tra Anderson-Darling về tính quy tắc và không yêu cầu bạn cung cấp giá trị trung bình và giá trị trung bình. Thử nghiệm này mạnh hơn về độ chính xác so với thử nghiệm Lilliefors.

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

"Độ chính xác" có thể dành cho một tìm kiếm hẹp nhưng sai lầm. Trong cả hai trường hợp, hầu hết các ứng dụng của một trong hai thử nghiệm này đều vô dụng và trong hầu hết các trường hợp đều sai lệch. Mọi người thường được dạy để sử dụng chúng bởi những người có hiểu biết sai lầm về các giả định về phương pháp hồi quy. Tôi đánh giá điểm yếu tương đối của bài kiểm tra KS sẽ làm cho nó thực sự "tốt hơn" khi sử dụng các lựa chọn thay thế mạnh hơn vì kết quả của nó sẽ ít gây hiểu lầm cho người dùng ngây thơ.
DWin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.