Tôi có một bộ dữ liệu chứa số lượng hành động được thực hiện bởi các cá nhân trong vòng 7 ngày. Các hành động cụ thể không nên có liên quan cho câu hỏi này. Dưới đây là một số thống kê mô tả cho tập dữ liệu:
Dưới đây là biểu đồ của dữ liệu:
Đánh giá từ nguồn dữ liệu, tôi đoán rằng nó sẽ phù hợp với phân phối Poisson. Tuy nhiên, phương sai trung bình và biểu đồ được đặt nặng ở bên trái. Ngoài ra, tôi đã chạy goodfit
thử nghiệm trong R và nhận được:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
Phương pháp Khả năng tối đa cũng mang lại giá trị p = 0. Giả sử giả thuyết null là: dữ liệu khớp với phân phối Poisson (tài liệu không chỉ định điều này), sau đó goodfit
thử nghiệm cho biết chúng ta nên từ chối giả thuyết null, do đó dữ liệu không phù hợp với phân phối Poisson.
Phân tích đó có đúng không? Nếu vậy, phân phối nào bạn nghĩ sẽ phù hợp với dữ liệu này?