Giả định hồi quy Poisson và cách kiểm tra chúng trong R


11

Tôi muốn kiểm tra xem hồi quy nào phù hợp với dữ liệu của tôi nhất. Biến phụ thuộc của tôi là một số đếm, và có rất nhiều số không.

Và tôi sẽ cần một số trợ giúp để xác định mô hình và gia đình nào sẽ sử dụng (poisson hoặc quasipoisson, hoặc hồi quy poisson bằng 0) và cách kiểm tra các giả định.

  1. Hồi quy Poisson: theo như tôi hiểu, giả định mạnh mẽ là biến phụ thuộc mean = phương sai. Làm thế nào để bạn kiểm tra điều này? Làm thế nào gần nhau để họ phải được? Là trung bình vô điều kiện hoặc có điều kiện và phương sai được sử dụng cho điều này? Tôi phải làm gì nếu giả định này không giữ được?
  2. Tôi đọc rằng nếu phương sai lớn hơn có nghĩa là chúng ta có sự quá mức, và một cách tiềm năng để đối phó với điều này là bao gồm nhiều biến độc lập hơn, hoặc Family = quasipoisson. Phân phối này có bất kỳ yêu cầu hoặc giả định nào khác không? Tôi sử dụng thử nghiệm nào để xem liệu (1) hoặc (2) phù hợp hơn - đơn giản anova(m1,m2)?
  3. Tôi cũng đọc rằng phân phối nhị thức âm có thể được sử dụng khi xuất hiện quá mức. Làm thế nào để tôi làm điều này trong R? Sự khác biệt với quasipoisson là gì?
  4. Hồi quy Poisson bằng 0: Tôi đọc được rằng bằng cách sử dụng kiểm tra vuong kiểm tra xem mô hình nào phù hợp hơn.

    > vuong (model.poisson, model.zero.poisson)

    Đúng không? Giả định nào mà hồi quy không thổi phồng có?

  5. Các dịch vụ công nghệ học thuật của UCLA, Nhóm tư vấn thống kê có một phần về các áp suất Poisson bằng 0 và kiểm tra mô hình zeroinflated (a) so với mô hình poisson tiêu chuẩn (b):

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

Tôi không hiểu | personsphần của mô hình đầu tiên làm gì và tại sao bạn có thể so sánh các mô hình này. Tôi đã dự kiến ​​hồi quy là như nhau và chỉ sử dụng một gia đình khác.

Câu trả lời:


8

1) Tính giá trị trung bình và phương sai mẫu. nên được phân phối , trong đó là kích thước của mẫu và quy trình thực sự là Poisson - vì chúng là ước tính độc lập của cùng một phương sai. F(1,n-1)nX¯S2F(1,n1)n

Lưu ý rằng thử nghiệm này bỏ qua các hiệp phương sai - vì vậy có lẽ không phải là cách tốt nhất để kiểm tra sự phân tán quá mức trong tình huống đó.

Cũng lưu ý rằng thử nghiệm này có lẽ yếu so với giả thuyết không thổi phồng.

3) nhị thức âm trong R: sử dụng glm.nbtừ MASSgói hoặc sử dụng zeroinflhàm từ psclgói bằng liên kết nhị thức âm.

4) zip (Po-zero-thổi phồng) là một mô hình hỗn hợp. Bạn có một kết quả nhị phân, theo đó một chủ đề thuộc nhóm A (trong đó 0 là chắc chắn) hoặc thuộc nhóm B (trong đó số đếm là Poisson hoặc nhị phân âm). Một số 0 được quan sát là do các đối tượng thuộc nhóm A + thuộc nhóm B, những người tình cờ gặp may mắn. Cả hai khía cạnh của mô hình có thể phụ thuộc vào hiệp phương sai: tư cách thành viên nhóm được mô hình hóa như một logistic (tỷ lệ cược log là tuyến tính trong hiệp phương sai) và phần Poisson được mô hình hóa theo cách thông thường: log có nghĩa là tuyến tính trong hiệp phương sai. Vì vậy, bạn cần các giả định thông thường cho một logistic (đối với phần 0 nhất định) và các giả định thông thường cho Poisson. Nói cách khác, một mô hình zip sẽ không chữa được các vấn đề quá mức của bạn - nó chỉ chữa được một số lượng lớn các số không.

5) không chắc chắn tập dữ liệu là gì và không thể tìm thấy tài liệu tham khảo. zeroinfl cần một mô hình cho cả phần poisson và phần nhị phân (nhất định 0 hoặc không). Phần 0 nhất định đi thứ hai. Vì vậy, ma đang nói rằng người đó có phải là 0 nhất định hay không phụ thuộc vào "người" - và giả sử đối tượng không phải là 0 nhất định, tính là một chức năng của người cắm trại và trẻ em. Nói cách khác, log (mean) là một hàm tuyến tính của camper và con cho những đối tượng không yêu cầu đếm 0.

mb chỉ là một mô hình tuyến tính tổng quát về mặt người cắm trại và trẻ em - cả hai đều được coi là hiệu ứng cố định. Hàm liên kết là Poisson.


Cảm ơn bạn! Một câu hỏi nhanh: có cách nào để tạo ra r ^ 2 hoặc pseudo-r ^ 2 như Nagelkerke trong glm bằng cách sử dụng Family = poisson trong R không? Cảm ơn bạn!
Torvon

0
  1. thư viện (pastecs)

stat.desc (dep_var) - và sau đó hãy xem nếu giá trị trung bình và phương sai bằng nhau. Từ đây bạn cũng có thể tính% số 0 trong vectơ của mình.


3
Chào mừng đến với trang web. Điều này giống như một bình luận hơn là một câu trả lời; Ngoài ra, tốt hơn là sử dụng đúng chính tả, v.v. - đây không phải là nhắn tin và nhiều người đọc trang web này có tiếng Anh là ngôn ngữ thứ 2 hoặc thứ 3 hoặc ....
Peter Flom - Tái lập Monica

3
Xin vui lòng, làm việc để cải thiện trả lời nhanh chóng này.
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.