Làm thế nào đại diện là phân phối Poisson phân phối các sự kiện trong thực tế?


8

Tôi đã luôn tự hỏi mức độ 'phù hợp' là phân phối Poisson tốt như thế nào đối với các sự kiện chúng ta quan sát trong thực tế. Hầu như tôi luôn thấy nó được sử dụng để mô hình hóa các sự kiện. (Ví dụ: xe đến trong nhà để xe hoặc số hoặc tin nhắn được gửi / nhận bởi máy chủ lưu trữ trên mạng, v.v.)

Chúng tôi thường mô hình hóa các sự kiện như vậy bằng Phân phối Poisson. Là phân phối chỉ là một xấp xỉ đầu tiên tốt cho cách mọi thứ xảy ra trong thực tế? Nếu tôi quan sát số lượng xe / ngày hoặc tin nhắn / ngày trong hai ví dụ trên và những chiếc được xuất ra bằng cách 'chọn từ bản phân phối' thì chúng khác nhau bao nhiêu? Làm thế nào tốt một xấp xỉ là Poisson? (Đây có phải là một xấp xỉ không?) 'Phép thuật' đằng sau Poisson là gì mà nó hiểu đúng (nói theo trực giác :)?


4
Có một số điểm khởi đầu tốt nếu bạn bắt nguồn từ phân phối poisson, điều đó cho thấy Poisson có nguồn gốc kỳ diệu từ phân phối nhị thức trong đó n lớn và cơ hội của một sự kiện là nhỏ. Từ đó, nó bắt đầu có ý nghĩa để sử dụng nó để mô hình các sự kiện đếm. Câu hỏi tôi đoán là làm thế nào để các sự kiện đếm thực sự phù hợp với sự mở rộng trơn tru của tình huống nhị thức.
Peter Ellis

Câu trả lời:


5

Một ví dụ tôi có thể nói là doanh số bán hàng siêu thị của Hàng tiêu dùng đóng gói (CPG). Đây cũng là các sự kiện được tính - siêu thị có thể bán 0 đơn vị một ngày, hoặc 1 hoặc 2, v.v., vì vậy việc phân phối Poisson có vẻ như là một sự phù hợp đầu tiên.

Tuy nhiên, phân phối nhị thức cơ bản @PeterEllis ghi chú không giữ. Có, chúng tôi có thể mô hình hóa số lượng khách hàng bằng nhị thức ... nhưng một số khách hàng sẽ mua 1 đơn vị, một số sẽ mua 2 đơn vị và một số sẽ tải kho chứa của họ và mua 10 đơn vị.

Kết quả thường sẽ được sử dụng quá mức, do đó phân phối nhị thức âm phù hợp hơn nhiều so với phân phối Poisson. (Đôi khi, chúng ta thậm chí có thể thấy sự thiếu hụt đối với các mặt hàng chuyển động rất nhanh như sữa).


3
+1. Chỉ cần nghĩ rằng điều đáng nói là Poisson là một trường hợp đặc biệt của Binomial âm và một cách để tạo ra nhị thức âm là một hỗn hợp của nhiều phân phối Poisson khác nhau với các phương tiện khác nhau.
David J. Harris

4

Nếu những thứ được tính là độc lập với nhau và tốc độ không đổi (hoặc theo một mô hình như trong hồi quy poisson) thì phân phối Poisson nói chung sẽ giữ khá tốt. Các ví dụ như ô tô đến nhà để xe có xu hướng hoạt động khá tốt (trong khoảng thời gian mà tốc độ khá ổn định, bao gồm cả giờ cao điểm và nửa đêm đối với nhà để xe của 9 đến 5 công nhân thường không hoạt động tốt). Thời gian bạn đến nhà để xe sẽ có ít hoặc ảnh hưởng đến thời gian tôi đến. Tuy nhiên, có một số trường hợp ngoại lệ là nếu 2 người sắp xếp gặp nhau tại một thời điểm nhất định thì họ có khả năng đến gần nhau hơn, nếu người này theo người kia thì họ sẽ còn thân thiết hơn nữa. Ngoài ra, những thứ như đèn giao thông gần đó có thể gây ra những cụm người đến không khớp với Poisson.

Nếu bạn muốn so sánh một tập dữ liệu cụ thể để xem Poisson có phù hợp hay không thì bạn có thể sử dụng một biểu đồ gốc treo .


1
+ cho các rootogram treo!
Mike Dunlavey

2

α>0β= =ln(α)α tiến đến 0, nghĩa là nhị thức âm tiếp cận Poisson, nhị thức âm trở nên khó tính.

Một cách khác để tăng độ phân tán là lạm phát bằng không, có thể được áp dụng cho nhị phân hoặc nhị phân âm. Để sử dụng điều đó, tại mỗi thời điểm đo lường, trước tiên hãy tiến hành thử nghiệm Bernoulli (lật một đồng xu). Nếu đồng xu là "đầu", phép đo bằng 0. Nếu không, phép đo được rút ra từ phân phối nhị thức Poisson hoặc âm.


2

Tôi đã thấy rằng nếu các sự kiện diễn ra đều đặn thì mô hình Poisson đánh giá quá cao phương sai (logic và hiển nhiên), trong khi nếu các sự kiện hóa ra được phân cụm thì mô hình Poisson đánh giá thấp phương sai. Phân phối Poisson được tạo từ quá trình điểm Poisson ngẫu nhiên.

tP(0,t)= =e-mộttmộttP(1,t),P(2,t),v.v ... công thức Poisson chung có nguồn gốc từ kiểm tra. C. Thống kê Chatfield cho công nghệ: một khóa học về thống kê ứng dụng , 2nd Ed. 1978, quán rượu. Chapman và Hội trường: xem trang 70-75.

Hai ví dụ này vi phạm yêu cầu ngẫu nhiên cơ bản. Nếu các sự kiện ít nhiều ngẫu nhiên thì mô hình Poisson là một mô hình công bằng. Ô tô đến một bãi đậu xe trung tâm thị trấn sầm uất có thể là một ví dụ về tập dữ liệu được nhóm, do 9 đến 5 người dùng, có lẽ?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.