Sử dụng và giải thích hợp lý các mô hình gamma không thổi phồng


11

Bối cảnh: Tôi là một nhà sinh học hiện đang vật lộn với một bộ dữ liệu về tỷ lệ biểu hiện tế bào. Nghiên cứu đã cho thấy một loạt các tế bào, được thu thập trong các nhóm từ các nhà tài trợ khác nhau, đến các peptide nhất định. Các tế bào hoặc thể hiện một số dấu ấn sinh học nhất định trong phản ứng, hoặc chúng không. Tỷ lệ phản hồi sau đó được ghi lại cho mỗi nhóm nhà tài trợ. Tỷ lệ đáp ứng (được biểu thị bằng tỷ lệ phần trăm) là kết quả của sự quan tâm và tiếp xúc với peptide là yếu tố dự đoán.

Lưu ý rằng các quan sát được nhóm trong các nhà tài trợ.

Vì tôi chỉ có dữ liệu tóm tắt, tôi đang coi tỷ lệ phản hồi của nhà tài trợ là dữ liệu liên tục (ít nhất là bây giờ).

Sự phức tạp nảy sinh từ việc tôi có nhiều số 0 trong dữ liệu của mình. Quá nhiều để được bỏ qua. Tôi đang xem xét một mô hình gamma không thổi phồng để đối phó với thực tế là tôi đã sai lệch dữ liệu liên tục cùng với sự dư thừa của các số 0. Tôi cũng đã xem xét mô hình Tobit, nhưng điều này có vẻ kém hơn vì nó giả định kiểm duyệt ở giới hạn thấp hơn, trái ngược với các số 0 chính hãng (các nhà kinh tế lượng có thể nói rằng sự khác biệt là moot).

Câu hỏi: Nói chung, khi nào thì thích hợp để sử dụng mô hình gamma không lạm phát? Đó là, các giả định là gì? Và làm thế nào để giải thích suy luận của nó? Tôi sẽ biết ơn các liên kết đến các bài báo thảo luận về điều này, nếu bạn có bất kỳ.

Tôi đã tìm thấy một liên kết trên SAS-L trong đó Dale McLerran cung cấp mã NLMIXED cho mô hình gamma có độ phồng bằng 0, do đó dường như là có thể. Tuy nhiên, tôi ghét bị buộc tội một cách mù quáng.

Câu trả lời:


5

Đầu tiên, bạn không thấy số không chính hãng trong dữ liệu biểu thức. Nhà sinh vật học của bạn đang nói rằng, giống như tất cả các nhà sinh học làm, nhưng khi một nhà sinh vật học nói "nó bằng không" thì thực sự nó có nghĩa là "nó nằm dưới ngưỡng phát hiện của tôi, vì vậy nó không tồn tại." Đó là một vấn đề ngôn ngữ do thiếu sự tinh tế toán học trong lĩnh vực này. Tôi nói từ kinh nghiệm cá nhân ở đây.

Giải thích về Gamma không thổi phồng trong liên kết bạn cung cấp là tuyệt vời. Quá trình vật lý dẫn đến dữ liệu của bạn là, nếu tôi hiểu nó, một nhà tài trợ được chọn, sau đó được xử lý bằng một peptide nhất định và phản ứng được đo từ các tế bào của nhà tài trợ đó. Có một vài lớp ở đây. Một là sức mạnh tổng thể của phản ứng của nhà tài trợ, đưa vào mức biểu hiện của từng tế bào cụ thể được đo. Nếu bạn diễn giải biến Bernoulli của mình trong Gamma không bị thổi phồng là "phản ứng của nhà tài trợ đủ mạnh để đo lường", thì có thể sẽ ổn. Chỉ cần lưu ý rằng trong trường hợp đó, bạn sẽ bỏ qua tiếng ồn của biểu hiện của từng ô riêng lẻ với sự thay đổi giữa các nhà tài trợ phản ứng mạnh. Vì tiếng ồn trong biểu hiện trong một ô được phân phối gần bằng gamma,

Nếu biến thể bổ sung từ các nhà tài trợ và các tế bào không làm hỏng Gamma phù hợp của bạn và bạn chỉ đang cố gắng để có được biểu hiện so với peptide được áp dụng, thì không có lý do gì điều này không ổn.

Nếu phân tích chi tiết hơn theo thứ tự, thì tôi khuyên bạn nên xây dựng một mô hình phân cấp tùy chỉnh để phù hợp với quy trình dẫn đến các phép đo của bạn.


3

Tôi đã tìm thấy một giải pháp mà tôi thấy khá thanh lịch. Có một bài viết xuất sắc trong tài liệu có tên "Phân tích dữ liệu đo lặp lại với độ vênh ở mức 0" cho thấy một mô hình lognatural bằng 0 được thổi phồng cho dữ liệu tương quan. Các tác giả cung cấp một macro SAS dựa trên PROC NLMIXED và khá dễ thực hiện. Tin tốt là điều này có thể đơn giản hóa cho các trường hợp mà không quan sát cụm bằng cách bỏ qua repeatedcâu lệnh trong macro. Tin xấu là NLMIXED chưa có nhiều cấu trúc tương quan mà chúng ta thường cần, chẳng hạn như tự phát.

Macro có tên MIXCORR và có một trang Wiki rất hữu ích mà bạn có thể tìm thấy ở đây . Bản thân macro có thể được tải xuống ở đây .

Tôi đánh giá cao tất cả các liên kết này. Hy vọng bạn tìm thấy chúng là hữu ích.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.