Có nhiều giải pháp cho trường hợp phân phối liên tục bằng không (bán):
- Hồi quy Tobit : giả sử rằng dữ liệu đến từ một phân phối Bình thường nằm bên dưới, nhưng các giá trị âm được kiểm duyệt và xếp chồng lên nhau (ví dụ: gói censReg )
- mô hình rào cản hoặc "hai giai đoạn": sử dụng mô hình nhị thức để dự đoán xem các giá trị là 0 hay> 0, sau đó sử dụng mô hình tuyến tính (hoặc Gamma hoặc cắt ngắn Bình thường hoặc log-Bình thường) để mô hình các giá trị khác không được quan sát
- Phân phối Tweedie : các phân phối trong họ hàm mũ cho một phạm vi các tham số hình dạng nhất định ( ) có khối lượng điểm bằng 0 và phân phối dương cho (ví dụ: gói tweedie , cplm )1 < p < 2x > 0
Hoặc, nếu cấu trúc dữ liệu của bạn đủ đơn giản, bạn có thể sử dụng các mô hình tuyến tính và sử dụng các phép thử hoán vị hoặc một số phương pháp mạnh mẽ khác để đảm bảo rằng suy luận của bạn không bị rối tung bởi sự phân phối dữ liệu thú vị.
Có các gói / giải pháp R có sẵn cho hầu hết các trường hợp này.
Có những câu hỏi khác về SE về dữ liệu liên tục (bán) được thổi phồng (ví dụ ở đây , ở đây và ở đây ), nhưng dường như chúng không cung cấp một câu trả lời chung rõ ràng ...
Xem thêm Min & Agresti, 2002, Mô hình hóa dữ liệu không âm với sự đóng cục ở mức 0: Một khảo sát để biết tổng quan.