Làm thế nào để mô hình hóa dữ liệu liên tục không âm không âm?


15

Tôi hiện đang cố gắng áp dụng mô hình tuyến tính ( family = gaussian) cho một chỉ số về đa dạng sinh học không thể lấy các giá trị thấp hơn 0, bị thổi phồng và liên tục. Giá trị nằm trong khoảng từ 0 đến hơn 0,25. Kết quả là, có một mô hình khá rõ ràng trong phần dư của mô hình mà tôi đã không thể loại bỏ: nhập mô tả hình ảnh ở đây

Có ai có bất kỳ ý tưởng về cách giải quyết điều này?


1
Chào mừng đến với CV! Lưu ý rằng tên người dùng, nhận dạng và liên kết đến trang người dùng của bạn sẽ tự động được thêm vào mỗi bài đăng bạn thực hiện, do đó không cần phải đăng bài viết của bạn. Trong thực tế, chúng tôi thích bạn không.
Cá bạc

3
Nếu nó được thổi phồng bằng 0 thì nó không thể liên tục, vì các biến liên tục không thể có bất kỳ bước nhảy nào trong cdf (và rõ ràng có một biến ở 0). Nó có thể liên tục ngoài 0.
Glen_b -Reinstate Monica

Câu trả lời:


31

Có nhiều giải pháp cho trường hợp phân phối liên tục bằng không (bán):

  • Hồi quy Tobit : giả sử rằng dữ liệu đến từ một phân phối Bình thường nằm bên dưới, nhưng các giá trị âm được kiểm duyệt và xếp chồng lên nhau (ví dụ: gói censReg )
  • mô hình rào cản hoặc "hai giai đoạn": sử dụng mô hình nhị thức để dự đoán xem các giá trị là 0 hay> 0, sau đó sử dụng mô hình tuyến tính (hoặc Gamma hoặc cắt ngắn Bình thường hoặc log-Bình thường) để mô hình các giá trị khác không được quan sát
  • Phân phối Tweedie : các phân phối trong họ hàm mũ cho một phạm vi các tham số hình dạng nhất định ( ) có khối lượng điểm bằng 0 và phân phối dương cho (ví dụ: gói tweedie , cplm )1<p<2x>0

Hoặc, nếu cấu trúc dữ liệu của bạn đủ đơn giản, bạn có thể sử dụng các mô hình tuyến tính và sử dụng các phép thử hoán vị hoặc một số phương pháp mạnh mẽ khác để đảm bảo rằng suy luận của bạn không bị rối tung bởi sự phân phối dữ liệu thú vị.

Có các gói / giải pháp R có sẵn cho hầu hết các trường hợp này.

Có những câu hỏi khác về SE về dữ liệu liên tục (bán) được thổi phồng (ví dụ ở đây , ở đâyở đây ), nhưng dường như chúng không cung cấp một câu trả lời chung rõ ràng ...

Xem thêm Min & Agresti, 2002, Mô hình hóa dữ liệu không âm với sự đóng cục ở mức 0: Một khảo sát để biết tổng quan.


@Ben Bolker Bạn có "sử dụng mô hình tuyến tính (hoặc Gamma hoặc cắt ngắn Bình thường hoặc log-Bình thường) để mô hình hóa" các giá trị khác không dự đoán hoặc thực tế không?
rolando2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.