Ví dụ về các quá trình không phải là Poisson?


15

Tôi đang tìm kiếm một số ví dụ hay về các tình huống không phù hợp với mô hình với phân phối Poisson, để giúp tôi giải thích phân phối Poisson cho sinh viên.

Người ta thường sử dụng số lượng khách hàng đến cửa hàng trong một khoảng thời gian làm ví dụ có thể được mô hình hóa bằng phân phối Poisson. Tôi đang tìm kiếm một ví dụ trong một tĩnh mạch tương tự, nghĩa là, một tình huống có thể được coi là một quá trình đếm tích cực trong thời gian liên tục rõ ràng không phải là Poisson.

Tình huống lý tưởng nên đơn giản và dễ hiểu nhất có thể, để giúp học sinh dễ dàng nắm bắt và ghi nhớ.


5
Câu hỏi này rất rộng. Trừ khi phạm vi được thu hẹp và thêm một số bối cảnh, rất có thể cuối cùng sẽ đóng cửa. Không có nghĩa là âm thanh khắc nghiệt không cần thiết, nó giống như hỏi: "một số ví dụ về hoa không phải là màu đỏ là gì?" (Cue Harry Chapin.)
Đức hồng y

1
Điểm lấy. Lời xin lỗi của tôi. Tôi nên làm cho nó cụ thể hơn. Tôi chỉnh sửa nó để cố gắng làm cho nó rõ ràng hơn.
Nagel

1
(+1) cho câu hỏi và nhận xét. Bản cập nhật tốt hơn nhiều. :-)
hồng y

2
Tôi sẽ giả sử bạn có nghĩa là "các quy trình nhất định mà mọi người ít nhất có thể ngây thơ xem xét một Poisson" (ví dụ: ít nhất là một quy trình đếm). Một ví dụ phổ biến xảy ra trong số các yêu cầu bồi thường đối với các chính sách bảo hiểm chung (bảo hiểm P & C), do một số yếu tố có thể xảy ra, rõ ràng nhất được phản ánh trong sự không đồng nhất trong tỷ lệ yêu cầu - do đó có sự chồng chất của các quy trình Poisson với cường độ khác nhau. Trong các tình huống phân phối tỷ lệ yêu cầu gần đúng bằng phân phối gamma, phân phối số lượng yêu cầu lần lượt được xấp xỉ bằng một nhị thức âm.
Glen_b -Reinstate Monica

Câu trả lời:


5

Số lượng thuốc lá được hút trong một khoảng thời gian: điều này đòi hỏi một quá trình bơm hơi bằng không (ví dụ Poisson bằng 0 hoặc bơm hơi âm tính bằng 0) vì không phải ai cũng hút thuốc lá.


Cảm ơn! Nhiều người ở đây đã đề cập đến các quy trình không thổi phồng, nhưng tôi nghĩ đây là ví dụ đơn giản và minh họa nhất đã được đưa ra: Số lượng thuốc lá được hút bởi một người được chọn ngẫu nhiên trong một khoảng thời gian.
Nagel

Có thể nói là một trở ngại với lập luận "không phải ai cũng hút thuốc", tuy nhiên, ở chỗ bạn có thể cho rằng quá trình này vẫn là Poisson, chỉ có thông số cường độ là dành riêng cho mỗi người và không biết (những người không hút thuốc sẽ có rất nhỏ cường độ) - phải không? Tuy nhiên, người ta cũng có thể lập luận rằng tình huống này vi phạm các giả định Poisson ở chỗ thuốc lá hút thuốc sẽ có xu hướng lan rộng ra cả ngày (đối với người hút thuốc thường xuyên) hoặc cụm (đối với người hút thuốc xã hội) để khoảng thời gian tách rời không độc lập. Vì vậy, đây vẫn là một ví dụ tốt, tôi nghĩ.
Nagel

1
Số lượng cá đánh bắt trong một khoảng thời gian, theo tôi là một ví dụ điển hình hơn cho ZIP và ZINB. Lập luận tương tự. Mặc dù, cá không có khả năng gây ảnh hưởng đến tỷ lệ tiêu thụ. (Tôi biết, tôi biết, ngoại trừ cho cá của mẹ bạn, bởi vì họ là rằng tốt :).
Alexis

8

Bạn có nghĩa là dữ liệu đếm tích cực? Không giới hạn?

Các nhị thức âm là phổ biến.

Một mô hình tốt khác là Poisson bị thổi phồng 0. Mô hình đó giả định rằng có điều gì đó đang xảy ra hoặc nó không xảy ra - và nếu có, nó đi theo Poisson. Tôi đã thấy một ví dụ gần đây. Các y tá điều trị bệnh nhân AIDS được hỏi về mức độ thường xuyên họ trải qua các hành vi kỳ thị từ người khác do sự liên quan của họ với bệnh nhân AIDS. Một số lượng lớn chưa bao giờ có kinh nghiệm như vậy, có thể là do nơi họ làm việc hoặc sinh sống. Trong số những người đã làm, số lượng kinh nghiệm kỳ thị khác nhau. Có nhiều số 0 được báo cáo hơn bạn mong đợi từ một Poisson thẳng, về cơ bản vì một tỷ lệ nhất định của nhóm được nghiên cứu đơn giản là không ở trong một môi trường khiến họ phải đối mặt với những hành vi như vậy.

Một hỗn hợp của Poisson cũng sẽ cung cấp cho bạn một quy trình xử lý điểm.


(+1) cho phân phối Poisson bằng không. Một cuộc thảo luận về mô hình này có thể được tìm thấy ở đây

1
+1 cho điều này (và các câu trả lời khác) cung cấp các ví dụ thực tế về các tình huống được đề cập trong câu hỏi, thay vì chỉ phân phối trừu tượng. Ví dụ này của ZIP là đặc biệt rõ ràng.
whuber

1
Đối với tín dụng của những người đã trả lời, tôi nên chỉ ra rằng câu hỏi của tôi ban đầu quá cẩu thả và hoàn toàn không đề cập đến các tình huống. Tôi đồng ý rằng Poisson bằng không là một ví dụ tốt. Tuy nhiên, tôi thấy nó hơi quá liên quan để giải thích cho sinh viên đại học, vì vậy tôi vẫn còn thiếu các ví dụ về các tình huống đơn giản không thể mô hình hóa bằng phân phối Poisson.
Nagel

4

Đếm các quá trình không phải là Poisson? Vâng, bất kỳ quá trình không gian mẫu hữu hạn như đồng phục nhị thức hoặc rời rạc. Bạn nhận được một quá trình đếm Poisson từ việc đếm các sự kiện có thời gian xen kẽ độc lập được phân bố theo cấp số nhân, do đó, một loạt các khái quát rơi ra từ đó như có gamma hoặc lognatural hoặc Weibull phân phối thời gian xen kẽ, hoặc bất kỳ loại thời gian xen kẽ không tham số trừu tượng nào phân phối.


Cảm ơn câu trả lời của bạn, và tôi rất xin lỗi vì câu hỏi của tôi ban đầu không rõ ràng. Tôi đã làm rõ nó bây giờ. Những gì bạn nói về các quá trình với thời gian xen kẽ không theo cấp số nhân và / hoặc phụ thuộc có ý nghĩa, nhưng bạn có bất kỳ ví dụ nào về các tình huống sẽ có các tính chất này, càng đơn giản càng tốt?
Nagel

4
Bạn đặt cược! Thời gian giữa các đợt bùng phát virus herpes. Bạn có thời gian lâu hơn để bùng phát ban đầu vì bạn thực sự phải nhiễm virus. Thời gian giữa các lần bùng phát của bạn sau đó là độc lập với nhau, nhưng đến với tốc độ nhanh hơn nhiều so với sự bùng phát chỉ số. Thời gian giữa các bên không theo cấp số nhân là tiêu chuẩn. Trong phân tích sinh tồn, một phương pháp phân tích thường được sử dụng là các mô hình Cox Proportional Hazards trong đó bạn loại bỏ mọi giả định tham số về thời gian giữa các đối thủ.
AdamO

Ví dụ tốt! Tôi đoán đây là một ví dụ khác của Poisson không phồng được đề cập bởi Placidia ở trên?
Nagel

4

Không rõ bạn có muốn đếm quá trình hay không.

Nếu tôi diễn giải thẻ 'dạy' có nghĩa là bạn đang dạy quá trình Poisson thì đối với việc dạy về một quá trình nói chung, quy trình Bernoulli là một quá trình ngẫu nhiên dễ dàng để giải thích và hình dung và có liên quan đến quá trình Poisson. Quá trình Bernoulli là tương tự rời rạc nên nó có thể là một khái niệm đồng hành hữu ích. Chỉ là thay vì thời gian liên tục, chúng ta có những khoảng thời gian riêng biệt.

Một ví dụ có thể là cánh cửa đến người bán hàng nơi chúng ta đang đếm những thành công của những ngôi nhà mua hàng.

  • Số lượng thành công trong n thử nghiệm đầu tiên, có phân
    phối nhị thức B (n, p) thay vì Poisson
  • Số lượng thử nghiệm cần thiết để có được thành công r, có phân phối nhị thức âm NB (r, p) thay vì phân phối gamma
  • Số lượng thử nghiệm cần thiết để có được một thành công, thời gian chờ đợi, có phân phối hình học NB (1, p), là dạng tương tự rời rạc của hàm mũ.

Đó là cách tiếp cận mà Bertsekas và Tsitsiklis sử dụng trong Giới thiệu Xác suất , tái bản lần thứ 2, giới thiệu quy trình Bernoulli trước quy trình Poisson. Trong sách giáo khoa của họ có nhiều phần mở rộng hơn cho quy trình Bernoulli có thể áp dụng cho quy trình Poisson như hợp nhất chúng hoặc phân vùng chúng, cũng như các vấn đề đặt ra với các giải pháp.

Nếu bạn đang tìm kiếm ví dụ về các quy trình ngẫu nhiên và bạn chỉ muốn ném tên ra khỏi đó, thì có khá nhiều.

Quá trình Gaussian là một quá trình quan trọng trong các ứng dụng. Quá trình Weiner nói riêng, là một loại quy trình Gaussian, còn được gọi là chuyển động Brownian tiêu chuẩn và có các ứng dụng trong tài chính và vật lý.


Cảm ơn câu trả lời của bạn, và tôi rất xin lỗi vì câu hỏi của tôi ban đầu quá lạc hậu và không rõ ràng. Tôi đã cố gắng làm rõ nó bây giờ. Liên kết từ Bernoulli đến Poisson rất thú vị, nhưng điều tôi đang tìm kiếm là những ví dụ về các tình huống trong thời gian liên tục không phù hợp để được mô hình hóa bởi một phân phối Poisson, càng đơn giản càng tốt.
Nagel

3

Là một tài sản / thương vong, tôi xử lý các ví dụ thực tế về các quy trình riêng biệt không phải là Poisson mọi lúc. Đối với các ngành kinh doanh có tần suất thấp, tần suất thấp, phân phối Poisson không phù hợp vì nó yêu cầu tỷ lệ phương sai so với trung bình là 1. Phân phối nhị thức âm, được đề cập ở trên, được sử dụng phổ biến hơn và phân phối Delaporte được sử dụng trong một số tài liệu, mặc dù ít thường xuyên hơn trong thực hành truyền thống tiêu chuẩn Bắc Mỹ.

Tại sao điều này là một câu hỏi sâu sắc hơn. Là nhị thức âm tốt hơn nhiều bởi vì nó đại diện cho một quá trình Poisson mà tham số trung bình là chính gamma được phân phối? Hoặc là do sự mất mát xảy ra không có tính độc lập (vì các sự kiện động đất xảy ra theo lý thuyết hiện tại rằng càng chờ trái đất trượt, thì càng có nhiều khả năng do áp lực tích tụ), đó là do không ổn định (các khoảng thời gian không thể được chia thành các chuỗi, mỗi chuỗi đều ổn định, cho phép sử dụng Poisson không đồng nhất) và chắc chắn một số dòng kinh doanh cho phép xảy ra đồng thời (ví dụ: sơ suất y tế với nhiều bác sĩ được bảo hiểm bởi chính sách).


2

Những người khác đã đề cập đến một số ví dụ về quá trình điểm không phải là Poisson. Bởi vì Poisson tương ứng với thời gian giữa các cấp số mũ nếu bạn chọn bất kỳ phân phối thời gian giữa các đối thủ không theo cấp số nhân, quá trình điểm kết quả không phải là Poisson. AdamO đã chỉ ra Weibull. Bạn có thể sử dụng gamma, lognatural hoặc beta nếu có thể.

Poisson có đặc tính là giá trị trung bình của nó bằng với phương sai của nó. Một quá trình điểm có phương sai lớn hơn giá trị trung bình đôi khi được gọi là quá mức và nếu giá trị trung bình lớn hơn phương sai thì nó được đánh giá thấp. Các thuật ngữ này được sử dụng để liên kết quá trình với Poisson. Nhị thức âm thường được sử dụng bởi vì nó có thể được sử dụng quá mức hoặc thiếu giá trị tùy thuộc vào các tham số của nó.

Poisson có phương sai không đổi. Một quá trình điểm phù hợp với các điều kiện Poisson ngoại trừ việc không có tham số tốc độ không đổi và do đó, trung bình và phương sai thay đổi theo thời gian được gọi là Poisson không đồng nhất.

Một quá trình với số lần xen kẽ theo cấp số nhân nhưng có thể có nhiều sự kiện tại thời điểm đến được gọi là hợp chất Poisson. Mặc dù tương tự như quy trình Poisson và có tên với từ Poisson trong đó, các quy trình Poisson không đồng nhất và hỗn hợp khác với quy trình điểm Poisson.


Cảm ơn câu trả lời của bạn, và tôi rất xin lỗi vì câu hỏi của tôi ban đầu quá lạc hậu và không rõ ràng. Tôi đã cố gắng làm rõ nó bây giờ. Bạn đề cập đến các quy trình với thời gian xen kẽ không theo cấp số nhân và / hoặc phụ thuộc, và những gì bạn nói về phân phối quá mức và thiếu phát triển là rất thú vị, nhưng bạn có bất kỳ ví dụ nào về các tình huống cụ thể sẽ có các tính chất này không? Càng đơn giản càng tốt :)
Nagel

1
Thay vì cố gắng đưa ra câu trả lời của riêng tôi, tôi nghĩ rằng thực sự có rất nhiều, rất nhiều ví dụ mà bạn có thể tìm thấy trong những cuốn sách liên quan đến quá trình đếm. Hãy để tôi khuyên bạn nên xem cuốn sách của Joe Hilbe về hồi quy nhị thức âm .
Michael R. Chernick

2

Một ví dụ thú vị khác về quá trình đếm không Poisson được thể hiện bằng phân phối Poisson không cắt ngắn (ZTPD). ZTPD có thể phù hợp với dữ liệu liên quan đến số lượng ngôn ngữ mà các đối tượng có thể nói trong điều kiện sinh lý. Trong trường hợp này, phân phối Poisson không hoạt động, bởi vì số lượng ngôn ngữ nói theo định nghĩa> = 1: do đó 0 bị loại trừ một tiên nghiệm.


2

Tôi tin rằng bạn có thể thực hiện quy trình Poisson khi khách hàng đến và điều chỉnh nó theo hai cách khác nhau: 1) lượng khách đến của khách hàng được đo 24 giờ một ngày, nhưng cửa hàng không thực sự mở cả ngày và 2) tưởng tượng hai cửa hàng cạnh tranh với Poisson xử lý thời gian đến của khách hàng và xem xét sự khác biệt giữa các khách đến tại hai cửa hàng. (Ví dụ # 2 là từ sự hiểu biết của tôi về Sổ tay thống kê kỹ thuật Springer, Phần A Thuộc tính 1.4.)


1

Bạn có thể muốn xem xét lại ví dụ bóng đá. Có vẻ như tỷ lệ ghi bàn của cả hai đội tăng lên khi trận đấu diễn ra, và họ thay đổi khi các đội thay đổi các ưu tiên tấn công / phòng thủ để đáp ứng với điểm số hiện tại.

Hay đúng hơn, sử dụng nó như một ví dụ về cách các mô hình đơn giản có thể thực hiện tốt đáng ngạc nhiên, kích thích sự quan tâm trong điều tra thống kê của một số hiện tượng, và cung cấp một chuẩn mực cho các nghiên cứu trong tương lai thu thập nhiều dữ liệu để điều tra sự khác biệt và đề xuất chi tiết.

Dixon & Robinson (1998), "Mô hình quy trình sinh cho các trận bóng đá hiệp hội", The Statistician , 47 , 3.


Tôi có linh cảm rằng các trận bóng đá không hoàn toàn Poisson, nhưng cảm ơn vì đã tham khảo :)
Nagel

1

Vì câu hỏi có liên quan đến việc làm cho phân phối Poisson trở nên dễ hiểu hơn, tôi sẽ giải quyết, vì gần đây tôi đã xem xét phần này cho các mẫu cuộc gọi đến của trung tâm cuộc gọi (theo phân phối theo cấp số nhân, theo thời gian).

Tôi nghĩ đi sâu vào một mô hình tiếp tuyến khác về cơ bản đòi hỏi kiến ​​thức về Poisson để nhận ra làm thế nào nó không phải là một điều khó hiểu, nhưng đó chỉ là tôi.

Tôi nghĩ rằng rắc rối với việc hiểu Poisson là trục thời gian liên tục xảy ra --- khi mỗi giây trôi qua, sự kiện sẽ không xảy ra nữa --- nhưng càng đi xa trong tương lai, bạn càng chắc chắn về nó đang xảy ra.

Thực sự, tôi nghĩ rằng nó đơn giản hóa sự hiểu biết nếu bạn chỉ trao đổi trục 'thời gian' cho 'thử nghiệm' hoặc 'sự kiện'.

Ai đó có thể sửa tôi nếu điều này không đúng, vì tôi cảm thấy đó là một lời giải thích dễ dàng, nhưng tôi nghĩ bạn có thể thay thế việc tung đồng xu, hoặc tung xúc xắc, với 'thời gian cho đến khi có cuộc gọi điện thoại' (tôi thường sử dụng cho Erlang C / nhân viên trung tâm cuộc gọi).

Thay vì 'thời gian cho đến khi một cuộc gọi điện thoại đến' ---- bạn có thể thay thế nó bằng ... 'cho đến khi một con xúc xắc chạm sáu'.

Điều đó tuân theo logic chung. Xác suất (giống như bất kỳ cờ bạc nào) hoàn toàn độc lập mỗi lần quay (hoặc phút) và không có bộ nhớ. Tuy nhiên, khả năng 'không 6' giảm chậm hơn bao giờ hết nhưng chắc chắn về 0 khi bạn tăng số lượng thử nghiệm. Sẽ dễ dàng hơn nếu bạn thấy cả hai biểu đồ (khả năng gọi theo thời gian, so với khả năng sáu với cuộn).

Tôi không biết điều đó có hợp lý không --- đó là điều đã giúp tôi kết hợp nó thành những điều khoản cụ thể. Bây giờ, phân phối poisson là một số đếm thay vì 'thời gian giữa các cuộc gọi' hoặc 'thử nghiệm cho đến khi sáu giờ' - nhưng nó phụ thuộc vào khả năng này.


Tôi có thể thấy bạn nghĩ điều này có thể gây nhầm lẫn cho sinh viên như thế nào, nhưng ý tưởng của tôi chỉ đơn giản là nó giúp tôi dễ dàng giải thích lý do tại sao số lượng khách hàng đến nhà hàng trong một khoảng thời gian là Poisson, nếu tôi có một quầy - ví dụ về một quy trình đơn giản với các sự kiện riêng biệt trong thời gian liên tục không phải là Poisson.
Nagel

1
Có nhiều lựa chọn, tôi nghĩ vậy. Một mô hình rõ ràng sẽ là các sự kiện tăng hoặc giảm xác suất với sự xuất hiện của chính họ. Khó nghĩ về một số ví dụ. Có lẽ kiến ​​đến nhà bếp / dã ngoại của bạn. Thời gian để con kiến ​​đầu tiên đến có lẽ lâu hơn nhiều so với con thứ hai hoặc thứ ba, và tất nhiên nhiều con kiến ​​đến có nghĩa là nhiều con kiến ​​đến trong tương lai (cho rằng những con đường mòn / giao tiếp của chúng với nhau). Không chắc chắn nếu điều đó sẽ được tính.
John Babson

1

Số lượt truy cập của một khách hàng cá nhân đến cửa hàng tạp hóa trong một khoảng thời gian nhất định.

Sau khi bạn đã đến cửa hàng tạp hóa, bạn sẽ không thể quay lại trong một thời gian trừ khi bạn mắc lỗi lập kế hoạch.

Tôi nghĩ rằng phân phối nhị thức âm có thể được sử dụng ở đây, nhưng nó rời rạc, trong khi các lượt truy cập trong thời gian liên tục.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.