Khi nào nên sử dụng các lỗi tiêu chuẩn mạnh mẽ trong hồi quy Poisson?


10

Tôi đang sử dụng mô hình hồi quy Poisson cho dữ liệu đếm và đang tự hỏi liệu có lý do nào để không sử dụng lỗi tiêu chuẩn mạnh cho các ước tính tham số không? Tôi đặc biệt quan tâm vì một số ước tính của tôi không mạnh mẽ là không đáng kể (ví dụ: p = 0,13) nhưng với mạnh mẽ là đáng kể (p <0,01).

Trong SAS, điều này có sẵn bằng cách sử dụng câu lệnh lặp lại trong proc genmod(ví dụ repeated subject=patid;:). Tôi đã sử dụng http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm như một ví dụ trích dẫn một bài báo của Cameron và Trivingi (2009) để hỗ trợ sử dụng các lỗi tiêu chuẩn mạnh mẽ.

Câu trả lời:


6

Nói chung, nếu bạn có bất kỳ nghi ngờ nào rằng các lỗi của bạn là không đồng nhất, bạn nên sử dụng các lỗi tiêu chuẩn mạnh mẽ. Thực tế là các ước tính của bạn trở nên không đáng kể khi bạn không sử dụng các SE mạnh mẽ cho thấy (nhưng không chứng minh) nhu cầu về các SE mạnh mẽ! Các SE này "mạnh mẽ" đối với sự thiên vị mà tính không đồng nhất có thể gây ra trong một mô hình tuyến tính tổng quát.

Tuy nhiên, tình huống này hơi khác một chút, ở chỗ bạn đang đặt chúng lên trên hồi quy Poisson.

Poisson có một đặc tính nổi tiếng là nó buộc độ phân tán phải bằng giá trị trung bình, cho dù dữ liệu có hỗ trợ điều đó hay không. Trước khi xem xét các lỗi tiêu chuẩn mạnh mẽ, tôi sẽ thử hồi quy nhị thức âm, không gặp phải vấn đề này. Có một bài kiểm tra (xem bình luận) để giúp xác định xem sự thay đổi kết quả trong các lỗi tiêu chuẩn có đáng kể hay không.

Tôi không biết chắc chắn liệu sự thay đổi mà bạn đang thấy (chuyển sang SE mạnh mẽ có thu hẹp CI) có ngụ ý phân tán hay không, nhưng có vẻ như vậy. Hãy xem mô hình thích hợp (tôi nghĩ nhị thức âm tính, nhưng một người nhanh nhẹn cũng gợi ý quasi-Poisson cho phân tán dưới?) Và xem những gì bạn nhận được trong cài đặt đó.


Câu trả lời tốt đẹp! Thông thường trong tính không đồng nhất OLS không làm cho các tham số không thiên vị (chỉ đơn thuần là không hiệu quả). Điều này không đúng mặc dù đối với các mô hình tuyến tính tổng quát, hãy xem bài đăng này của Dave Giles về nó để tham khảo. Tôi không nghĩ rằng tôi đã thấy thử nghiệm Vương đề nghị cho điều này mặc dù (để so sánh các mô hình thổi phồng không lồng nhau mà tôi đã thấy nó được đề xuất). Poisson được lồng trong Neg. Mô hình nhị thức, vì vậy người ta có thể sử dụng thử nghiệm tỷ lệ khả năng cho tham số phân tán.
Andy W

Cảm ơn câu trả lời của bạn. Tôi đã thử hồi quy Binomial âm nhưng chạy vào cảnh báo: "Tiêu chí hội tụ Hessian tương đối của 0,0046138565 lớn hơn giới hạn 0,0001. Sự hội tụ là nghi vấn." Lưu ý rằng biến trả lời của tôi là một số có các giá trị nằm trong khoảng từ 0 đến 4. Có sự biến đổi của biến phụ thuộc hoặc biến độc lập sẽ giúp hội tụ không? Hoặc người ta làm gì trong trường hợp này?
kara

Ngoài ra, liên quan đến các SE không mạnh mẽ nhỏ hơn - theo phân tích của tôi, tôi thấy rằng đó là các SE mạnh mẽ nhỏ hơn và đây là nơi có ý nghĩa (không nằm trong kết quả không mạnh mẽ). Đây là lý do tại sao tôi muốn cẩn thận về việc có báo cáo kết quả mạnh mẽ hay không - tôi không muốn chọn phương pháp này chỉ vì giá trị quan trọng! Cảm ơn một lần nữa!
kara

@AndyW Tôi đã kiểm tra ghi chú của mình và Vương thực sự là cho ZI vs Poisson. Cập nhật bài viết. kara tôi đã bỏ lỡ sự đảo ngược. Bạn có thể có dữ liệu phân tán dưới mức, trong trường hợp đó NBD cũng có khả năng là giải pháp :-)
Ari B. Friedman

@kara Khó chẩn đoán vấn đề không hội tụ của bạn trong các bình luận. Tôi sẽ thử một câu hỏi mới với nhiều thông tin mà bạn có thể cung cấp.
Ari B. Friedman

1

Tôi sẽ phân biệt các phân tích bằng cách sử dụng các lỗi tiêu chuẩn dựa trên mô hình và mạnh mẽ bằng cách gọi cái sau là "GEE", thực tế là một định nghĩa có thể trao đổi. Ngoài lời giải thích tuyệt vời của Scortchi:

GEE có thể được "thiên vị" trong các mẫu nhỏ, ví dụ 10-50 đối tượng: (Lipsitz, Laird, và Harrington, 1990; Emrich và Piedmonte, 1992; Sharples và Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte, và Williams, 1994; Gunscar, Getchell, và Chinchilli, 1995; Sherman và le Cessie, 1997.) , tùy thuộc vào giá trị phù hợp nào thể hiện hành vi này và mức độ phù hợp của chúng với xu hướng chung của mô hình hồi quy.

Nói chung, khi mô hình tham số được chỉ định chính xác, bạn vẫn nhận được ước tính lỗi chuẩn chính xác từ các TCTD dựa trên mô hình, nhưng toàn bộ quan điểm sử dụng GEE là để phù hợp với "nếu" rất lớn đó. GEE cho phép nhà thống kê chỉ xác định mô hình xác suất làm việc cho dữ liệu và các tham số (thay vì được giải thích trong khung tham số nghiêm ngặt) được coi là một loại "sàng" có thể tạo ra các giá trị có thể lặp lại bất kể việc tạo dữ liệu không xác định bên dưới cơ chế. Đây là trái tim và linh hồn của phân tích bán tham số, mà một GEE là một ví dụ về.

GEE cũng xử lý các nguồn cộng hưởng không được đo lường trong dữ liệu, ngay cả với đặc điểm kỹ thuật của ma trận tương quan độc lập. Điều này là do việc sử dụng ma trận hiệp phương sai dựa trên mô hình chứ không phải mô hình. Ví dụ, trong mô hình Poisson, bạn có thể quan tâm đến tỷ lệ sinh sản của cá hồi được lấy mẫu từ nhiều dòng khác nhau. Loài ova được thu hoạch từ cá cái có thể có phân bố Poisson cơ bản, nhưng biến thể di truyền bao gồm khả năng di truyền chung và các nguồn tài nguyên có sẵn trong các luồng cụ thể có thể khiến cá trong các luồng đó giống nhau hơn so với các luồng khác. GEE sẽ đưa ra các ước tính lỗi tiêu chuẩn dân số chính xác miễn là tỷ lệ lấy mẫu phù hợp với tỷ lệ dân số của họ (hoặc theo các cách khác được phân tầng).


1

Bạn làm một bài kiểm tra null của đẳng thức. Đó là một hồi quy OLS phụ trợ đơn giản. Có mô tả trên trang 670 của Cameron và Trivingi. Với mức độ vượt quá lớn, các lỗi tiêu chuẩn rất dễ bị xì hơi, vì vậy tôi sẽ rất cảnh giác với bất kỳ kết quả nào xoay quanh một VCE không mạnh mẽ khi có sự thay thế quá mức. Với sự thiếu sót, điều ngược lại sẽ đúng, nghe có vẻ giống như kịch bản bạn đang tham gia.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.