Cảm ơn bạn cho câu hỏi thú vị!
Sự khác biệt: Một hạn chế của các mô hình đếm tiêu chuẩn là các số 0 và số khác (dương) được giả định là đến từ cùng một quá trình tạo dữ liệu. Với các mô hình rào cản , hai quá trình này không bị hạn chế là giống nhau. Ý tưởng cơ bản là xác suất Bernoulli chi phối kết quả nhị phân cho dù một biến số đếm có thực hiện bằng 0 hay dương. Nếu việc thực hiện là tích cực, rào cản được vượt qua và phân phối có điều kiện của các mặt tích cực được điều chỉnh bởi một mô hình dữ liệu đếm rút ngắn ở mức 0. Với các mô hình không phồng, biến trả lời được mô hình hóa như một hỗn hợp của phân phối Bernoulli (hoặc gọi nó là khối lượng điểm bằng 0) và phân phối Poisson (hoặc bất kỳ phân phối đếm nào khác được hỗ trợ trên các số nguyên không âm). Để biết thêm chi tiết và công thức, xem, ví dụ, Gurmu và Trivingi (2011) và Dalrymple, Hudson và Ford (2003).
Ví dụ: Các mô hình vượt rào có thể được thúc đẩy bởi các quá trình ra quyết định tuần tự mà các cá nhân phải đối mặt. Trước tiên, bạn quyết định xem bạn có cần mua thứ gì không, và sau đó bạn quyết định số lượng của thứ đó (phải là số dương). Khi bạn được phép (hoặc có khả năng) không mua gì sau khi bạn quyết định mua thứ gì đó là một ví dụ về tình huống mô hình không lạm phát là phù hợp. Zeros có thể đến từ hai nguồn: a) không có quyết định mua; b) muốn mua nhưng cuối cùng không mua gì (ví dụ hết hàng).
Beta: Mô hình rào cản là trường hợp đặc biệt của mô hình hai phần được mô tả trong Chương 16 của Frees (2011). Ở đó, chúng ta sẽ thấy rằng đối với các mô hình hai phần, lượng chăm sóc sức khỏe được sử dụng có thể là một biến số liên tục cũng như đếm. Vì vậy, cái được gọi một cách khó hiểu là "phân phối beta không phồng" trong tài liệu trên thực tế thuộc về lớp phân phối và mô hình hai phần (rất phổ biến trong khoa học chuyên gia tính toán), phù hợp với định nghĩa trên của mô hình rào cản . Cuốn sách tuyệt vời này đã thảo luận về các mô hình không phồng lên trong phần 12.4.1 và các mô hình vượt rào trong phần 12.4.2, với các công thức và ví dụ từ các ứng dụng Actuarial.
Lịch sử: các mô hình Poisson (ZIP) không bị thổi phồng mà không có đồng biến có một lịch sử lâu dài (xem ví dụ: Johnson và Kotz, 1969). Hình thức chung của các mô hình hồi quy ZIP kết hợp hiệp phương sai là do Lambert (1992). Các mô hình vượt rào được đề xuất đầu tiên bởi một nhà thống kê người Canada Cragg (1971), và sau đó được phát triển thêm bởi Mullahy (1986). Bạn cũng có thể xem xét Croston (1972), trong đó số lượng hình học dương được sử dụng cùng với quy trình Bernoulli để mô tả một quy trình có giá trị nguyên được thống trị bởi các số không.
R: Cuối cùng, nếu bạn sử dụng R, có gói pscl cho "Các lớp và phương pháp cho R được phát triển trong Phòng thí nghiệm tính toán khoa học chính trị" của Simon Jackman, có chứa các hàm Hurdle () và zeroinfl () của Achim Zeileis.
Các tài liệu tham khảo sau đây đã được tư vấn để sản xuất ở trên:
- Gurmu, S. & Trivingi, Số dư thừa PK trong các mô hình đếm cho các chuyến đi giải trí Tạp chí Thống kê Kinh doanh & Kinh tế, 1996, 14, 469-477
- Johnson, N., Kotz, S., Phân phối trong Thống kê: Phân phối rời rạc. 1969, Houghton MiZin, Boston
- Lambert, D., hồi quy Poisson bằng không với một ứng dụng cho các khiếm khuyết trong sản xuất. Technometrics, 1992, 34 (1), 1 trận14.
- Cragg, JG Một số mô hình thống kê cho các biến phụ thuộc có giới hạn với ứng dụng cho nhu cầu đối với hàng hóa lâu bền Kinh tế lượng, 1971, 39, 829-844
- Mullahy, J. Đặc điểm kỹ thuật và thử nghiệm một số mô hình dữ liệu đếm được sửa đổi Tạp chí Kinh tế lượng, 1986, 33, 341-365
- Frees, Mô hình hồi quy EW với các ứng dụng tài chính và tài chính của Đại học Cambridge, 2011
- Dalrymple, ML; Hudson, IL & Ford, RPK Finite Hỗn hợp, các mô hình Poisson và Hurdle không phồng bằng ứng dụng cho Phân tích dữ liệu và thống kê tính toán của SIDS, 2003, 41, 491-504
- Croston, Dự báo JD và Kiểm soát chứng khoán cho các nghiên cứu hoạt động không liên tục hàng quý, năm 1972, 23, 289-303