Một trong những sức mạnh của mô hình hồi quy nói chung là bạn có thể làm trơn tru các khu vực không có dữ liệu - mặc dù như bạn đã nhận thấy, đôi khi có vấn đề trong việc ước tính các tham số. Tôi sẽ đề nghị rằng nếu bạn nhận được những thứ như lỗi tiêu chuẩn vô hạn thì đã đến lúc phải xem xét lại phương pháp mô hình hóa của bạn.
Một lưu ý đặc biệt cần thận trọng: Có một sự khác biệt giữa "Không có số lượng" trong một tầng lớp cụ thể và không thể có số lượng trong tầng đó. Ví dụ, hãy tưởng tượng bạn đang thực hiện một nghiên cứu về các rối loạn tâm lý cho Hải quân Hoa Kỳ từ năm 2000 đến 2009 và có các thuật ngữ hồi quy nhị phân cho cả "Là phụ nữ" và "Phục vụ trên tàu ngầm". Một mô hình hồi quy có thể ước tính các hiệu ứng trong đó cả hai biến = 1 mặc dù có số không trong đó cả hai = 1. Tuy nhiên suy luận đó sẽ không hợp lệ - trường hợp như vậy là không thể. Vấn đề này được gọi là "không tích cực" và đôi khi là một vấn đề trong các mô hình phân tầng cao.
glm
thói quen sẽ bon chen nếu nó không thể xử lý số không. Bạn đã thử chưa?