Bối cảnh: Tôi là một nhà sinh học hiện đang vật lộn với một bộ dữ liệu về tỷ lệ biểu hiện tế bào. Nghiên cứu đã cho thấy một loạt các tế bào, được thu thập trong các nhóm từ các nhà tài trợ khác nhau, đến các peptide nhất định. Các tế bào hoặc thể hiện một số dấu ấn sinh học nhất định trong phản ứng, hoặc chúng không. Tỷ lệ phản hồi sau đó được ghi lại cho mỗi nhóm nhà tài trợ. Tỷ lệ đáp ứng (được biểu thị bằng tỷ lệ phần trăm) là kết quả của sự quan tâm và tiếp xúc với peptide là yếu tố dự đoán.
Lưu ý rằng các quan sát được nhóm trong các nhà tài trợ.
Vì tôi chỉ có dữ liệu tóm tắt, tôi đang coi tỷ lệ phản hồi của nhà tài trợ là dữ liệu liên tục (ít nhất là bây giờ).
Sự phức tạp nảy sinh từ việc tôi có nhiều số 0 trong dữ liệu của mình. Quá nhiều để được bỏ qua. Tôi đang xem xét một mô hình gamma không thổi phồng để đối phó với thực tế là tôi đã sai lệch dữ liệu liên tục cùng với sự dư thừa của các số 0. Tôi cũng đã xem xét mô hình Tobit, nhưng điều này có vẻ kém hơn vì nó giả định kiểm duyệt ở giới hạn thấp hơn, trái ngược với các số 0 chính hãng (các nhà kinh tế lượng có thể nói rằng sự khác biệt là moot).
Câu hỏi: Nói chung, khi nào thì thích hợp để sử dụng mô hình gamma không lạm phát? Đó là, các giả định là gì? Và làm thế nào để giải thích suy luận của nó? Tôi sẽ biết ơn các liên kết đến các bài báo thảo luận về điều này, nếu bạn có bất kỳ.
Tôi đã tìm thấy một liên kết trên SAS-L trong đó Dale McLerran cung cấp mã NLMIXED cho mô hình gamma có độ phồng bằng 0, do đó dường như là có thể. Tuy nhiên, tôi ghét bị buộc tội một cách mù quáng.