Biến phụ thuộc
Tôi có một giá trị phụ thuộc trong phạm vi [0,1]. Có nghĩa là 0 và 1, và tất cả các giá trị ở giữa được bao gồm. Do đó, đây là một giá trị tỷ lệ, chẳng hạn như tỷ lệ phần trăm đất mà nông dân thụ tinh.
Mô hình
Mô hình tôi hiện đang tập trung vào là một mô hình logistic.
- Tuy nhiên, là một đầu ra, tôi muốn xem mô hình biến phụ thuộc của tôi được dự đoán như thế nào (để so sánh các giá trị thực với các giá trị ước tính).
Tuy nhiên, hồi quy logistic thường đưa ra như một "xác suất" đầu ra. Kết quả là bây giờ tôi hơi bối rối.
Mô hình của tôi =
out <- glm(cbind(fertilized, total_land-fertilized) ~ X-variables,
family=binomial(cloglog), data=Alldata)
Để dự đoán tỷ lệ đất được ước tính tôi sử dụng
Alldata$estimated_fertilized<-predict(out,data=newdata,type="response"))
Điều này có đúng không? Hay dòng này cho tôi xác suất thay vì tỷ lệ phần trăm dự đoán? Nếu không đúng, tôi nên làm gì để có được thứ mình muốn?
CẬP NHẬT
Với thực tế là có những câu hỏi về tính chính xác của mô hình đã chọn, tôi cung cấp một số thông tin bổ sung: