Tôi có một câu hỏi về phân phối chính xác để sử dụng để tạo một mô hình với dữ liệu của tôi. Tôi đã tiến hành kiểm kê rừng với 50 lô, mỗi ô có kích thước 20m × 50m. Đối với mỗi ô, tôi ước tính tỷ lệ tán cây che phủ mặt đất. Mỗi ô có một giá trị, tính bằng phần trăm, cho độ che phủ của tán cây. Tỷ lệ phần trăm từ 0 đến 0,95. Tôi đang tạo một mô hình che phủ tán cây phần trăm ( biến Y ), với ma trận các biến X độc lập dựa trên hình ảnh vệ tinh và dữ liệu môi trường.
Tôi không chắc chắn liệu tôi có nên sử dụng phân phối nhị thức hay không, vì biến ngẫu nhiên nhị thức là tổng của n thử nghiệm độc lập (nghĩa là biến ngẫu nhiên Bernoulli). Các giá trị phần trăm không phải là tổng của các thử nghiệm; chúng là tỷ lệ phần trăm thực tế. Tôi có nên sử dụng gamma, mặc dù nó không có giới hạn trên? Tôi có nên chuyển đổi tỷ lệ phần trăm thành số nguyên và sử dụng Poisson dưới dạng đếm không? Tôi có nên gắn bó với Gaussian? Tôi đã không tìm thấy nhiều ví dụ trong tài liệu hoặc trong sách giáo khoa cố gắng mô hình hóa tỷ lệ phần trăm theo cách này. Bất kỳ gợi ý hoặc hiểu biết đều được đánh giá cao.
Cảm ơn bạn cho câu trả lời của bạn. Trong thực tế, bản phân phối beta chính xác là những gì tôi cần và được thảo luận kỹ lưỡng trong bài viết này:
Eskelson, BN, Madsen, L., Hagar, JC, & Temesgen, H. (2011). Ước tính độ che phủ của thảm thực vật Ripary với mô hình hồi quy Beta và copula. Khoa học lâm nghiệp, 57 (3), 212-221.
Các tác giả này sử dụng gói betareg trong R của Cribari-Neto và Zeileis.
Bài viết sau đây thảo luận về một cách hay để chuyển đổi biến phản hồi phân phối beta khi nó bao gồm các số 0 thực và / hoặc 1 trong phạm vi tỷ lệ phần trăm:
- Smithson, M. và J. Verkuilen, 2006. Máy vắt chanh tốt hơn? Hồi quy khả năng tối đa với các biến phụ thuộc phân phối beta , Phương pháp tâm lý, 11 (1): 54 thép71.