1) Những gì được mô tả dường như là (nhóm) dữ liệu liên tục được vẽ dưới dạng biểu đồ thanh.
Bạn hoàn toàn có thể kết luận rằng đó không phải là bản phân phối Poisson.
Biến ngẫu nhiên Poisson lấy các giá trị 0, 1, 2, ... và có đỉnh cao nhất ở 0 chỉ khi giá trị trung bình nhỏ hơn 1. Nó được sử dụng cho dữ liệu đếm; nếu bạn đã vẽ biểu đồ tương tự của dữ liệu Poisson, nó có thể trông giống như các ô bên dưới:
Đầu tiên là một Poisson cho thấy độ lệch tương tự với bạn. Bạn có thể thấy ý nghĩa của nó khá nhỏ (khoảng 0,6).
Thứ hai là một Poisson có nghĩa tương tự (theo phỏng đoán rất thô sơ) với bạn. Như bạn thấy, nó trông khá cân xứng.
Bạn có thể có độ lệch hoặc trung bình lớn, nhưng không phải cả hai cùng một lúc.
2) (i) Bạn không thể biến dữ liệu rời rạc thành bình thường -
Với dữ liệu được nhóm, sử dụng bất kỳ phép biến đổi tăng đơn điệu nào, bạn sẽ di chuyển tất cả các giá trị trong một nhóm đến cùng một vị trí, vì vậy nhóm thấp nhất sẽ vẫn có đỉnh cao nhất - xem sơ đồ bên dưới. Trong biểu đồ đầu tiên, chúng tôi di chuyển vị trí của các giá trị x để khớp với một cdf bình thường:
Trong biểu đồ thứ hai, chúng ta thấy hàm xác suất sau khi biến đổi. Chúng tôi thực sự không thể đạt được bất cứ điều gì như tính bình thường bởi vì cả hai đều rời rạc và lệch; bước nhảy lớn của nhóm đầu tiên sẽ vẫn là một bước nhảy lớn, bất kể bạn đẩy nó sang trái hay phải.
(ii) Dữ liệu sai lệch liên tục có thể được chuyển đổi để trông hợp lý bình thường. Nếu bạn có các giá trị thô (chưa được nhóm) và chúng không rời rạc nhiều, bạn có thể làm gì đó, nhưng ngay cả khi mọi người tìm cách chuyển đổi dữ liệu của họ, điều đó không cần thiết hoặc vấn đề tiềm ẩn của họ có thể được giải quyết theo cách khác (nói chung là tốt hơn) . Đôi khi biến đổi là một lựa chọn tốt, nhưng nó thường được thực hiện vì những lý do không chính đáng.
Vậy ... tại sao bạn muốn biến đổi nó?