Tôi phù hợp với một mô hình hiệu ứng ngẫu nhiên với glmer
một số dữ liệu kinh doanh. Mục đích là để phân tích hiệu suất bán hàng của nhà phân phối, có tính đến sự thay đổi trong khu vực. Tôi có các biến sau:
distcode
: ID nhà phân phối, với khoảng 800 cấp độregion
: ID địa lý cấp cao nhất (bắc, nam, đông, tây)zone
: địa lý cấp trung được lồng trongregion
, khoảng 30 cấp trong tất cảterritory
: địa lý cấp thấp lồng trongzone
, khoảng 150 cấp
Mỗi nhà phân phối chỉ hoạt động trong một lãnh thổ. Phần khó khăn là đây là dữ liệu tóm tắt, với một điểm dữ liệu cho mỗi nhà phân phối. Vì vậy, tôi có 800 điểm dữ liệu và tôi đang cố gắng khớp (ít nhất) 800 thông số mặc dù theo kiểu thông thường.
Tôi đã trang bị một mô hình như sau:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
Điều này chạy mà không có vấn đề, mặc dù nó in một ghi chú:
Số cấp của một yếu tố nhóm cho các hiệu ứng ngẫu nhiên bằng n, số lượng quan sát
Đây có phải là một điều hợp lý để làm? Tôi nhận được ước tính hữu hạn của tất cả các hệ số và AIC cũng không hợp lý. Nếu tôi thử GLMM poisson với liên kết nhận dạng, AIC sẽ tệ hơn nhiều vì vậy liên kết nhật ký ít nhất là một điểm khởi đầu tốt.
Nếu tôi vẽ các giá trị được trang bị so với phản hồi, tôi sẽ nhận được những gì cơ bản là phù hợp hoàn hảo, mà tôi đoán là vì tôi có một điểm dữ liệu cho mỗi nhà phân phối. Điều đó có hợp lý không, hay tôi đang làm điều gì đó hoàn toàn ngớ ngẩn?
Đây là sử dụng dữ liệu trong một tháng. Tôi có thể nhận dữ liệu trong nhiều tháng và nhận được một số sao chép theo cách đó, nhưng tôi phải thêm các thuật ngữ mới cho biến thể theo tháng và các tương tác có thể, đúng không?
ETA: Tôi đã chạy lại mô hình trên, nhưng không có family
đối số (vì vậy chỉ là một LMM gaussian chứ không phải GLMM). Bây giờ lmer
đã cho tôi các lỗi sau:
Lỗi trong (hàm (fr, FL, start, REML, verbose): Số cấp của một yếu tố nhóm cho các hiệu ứng ngẫu nhiên phải nhỏ hơn số lượng quan sát
Vì vậy, tôi đoán rằng tôi không làm điều gì đó hợp lý, vì thay đổi gia đình không nên có ảnh hưởng. Nhưng câu hỏi bây giờ là, tại sao nó lại hoạt động ngay từ đầu?