Trong R, tôi có một mẫu gồm 349 biện pháp và muốn biết liệu tôi có thể giả sử nó được phân phối bình thường cho các thử nghiệm trong tương lai hay không.
Về cơ bản theo một câu trả lời Stack khác , tôi đang xem xét cốt truyện mật độ và cốt truyện QQ với:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
Tôi không có kinh nghiệm mạnh mẽ về Thống kê, nhưng chúng trông giống như các ví dụ về phân phối bình thường mà tôi đã thấy.
Sau đó, tôi đang chạy thử nghiệm Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Nếu tôi giải thích nó một cách chính xác, nó sẽ cho tôi biết rằng việc từ chối giả thuyết null là an toàn, đó là sự phân phối là bình thường.
Tuy nhiên, tôi đã gặp hai bài viết Stack ( ở đây và ở đây ), điều này làm giảm mạnh tính hữu ích của bài kiểm tra này. Có vẻ như nếu mẫu lớn (được coi là lớn?), Nó sẽ luôn nói rằng phân phối không bình thường.
Làm thế nào tôi nên giải thích tất cả những điều đó? Tôi có nên gắn bó với cốt truyện QQ và cho rằng phân phối của tôi là bình thường?