Tôi có một thử nghiệm đo lặp lại trong đó biến phụ thuộc là tỷ lệ phần trăm và tôi có nhiều yếu tố là biến độc lập. Tôi muốn sử dụng glmer
từ gói R lme4
để coi nó như một vấn đề hồi quy logistic (bằng cách chỉ định family=binomial
) vì nó dường như phù hợp với thiết lập này trực tiếp.
Dữ liệu của tôi trông như thế này:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
và đây là lệnh R mà tôi hy vọng sẽ phù hợp:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
Vấn đề với điều này là lệnh phàn nàn về biến phụ thuộc của tôi không phải là số nguyên:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
và phân tích dữ liệu (thí điểm) này cho kết quả kỳ lạ.
Tôi hiểu lý do tại sao binomial
gia đình mong đợi số nguyên (có - không tính), nhưng có vẻ như sẽ ổn khi lấy lại dữ liệu phần trăm trực tiếp. làm như thế nào?