Tôi tranh chấp các xác nhận từ một số quan điểm:
i) Mặc dù liên kết chính tắc có thể là 'có vấn đề', nhưng không rõ ràng ngay lập tức rằng ai đó sẽ quan tâm đến liên kết đó - trong khi đó, ví dụ, liên kết nhật ký trong Poisson thường thuận tiện và tự nhiên, và vì vậy mọi người thường quan tâm đến điều đó. Mặc dù vậy, trong trường hợp Poisson mọi người nhìn vào các chức năng liên kết khác.
Vì vậy, chúng tôi không cần hạn chế xem xét đến liên kết chính tắc.
Một "liên kết có vấn đề" không phải là một lý lẽ đặc biệt để chống lại hồi quy nhị thức âm.
Ví dụ, liên kết nhật ký dường như là một lựa chọn khá hợp lý trong một số ứng dụng nhị thức âm, ví dụ, trong trường hợp dữ liệu có thể là Poisson một cách có điều kiện nhưng có sự không đồng nhất về tốc độ Poisson - liên kết nhật ký có thể gần như có thể hiểu được như trong trường hợp Poisson.
Để so sánh, tôi sử dụng Gamma GLM một cách hợp lý thường xuyên, nhưng tôi không nhớ (ví dụ trong sách giáo khoa) đã từng sử dụng liên kết chính tắc của nó - Tôi sử dụng liên kết nhật ký hầu như luôn luôn, vì đó là một liên kết tự nhiên hơn để sử dụng cho các loại vấn đề Tôi có xu hướng làm việc với.
ii) "Dường như ít được tạo ra ... trong các ứng dụng" có thể gần như đúng vào năm 1989, nhưng tôi không nghĩ rằng nó hiện đang tồn tại. [Ngay cả khi nó đã đứng vững, đó không phải là một cuộc tranh luận rằng đó là một mô hình kém, chỉ là nó không được sử dụng rộng rãi - điều này có thể xảy ra vì mọi lý do.]
Hồi quy nhị thức âm đã trở nên được sử dụng rộng rãi hơn vì nó có sẵn rộng rãi hơn và tôi thấy nó được sử dụng rộng rãi hơn trong các ứng dụng hiện nay. Ví dụ, trong R, tôi sử dụng các hàm trong MASS
đó hỗ trợ nó (và cuốn sách tương ứng, Venables và Ripley, Thống kê ứng dụng hiện đại với S , sử dụng hồi quy nhị thức âm trong một số ứng dụng thú vị) - và tôi đã sử dụng một số chức năng trong một vài gói khác ngay cả trước khi tôi sử dụng nó trong R.
Tôi đã sử dụng hồi quy nhị thức âm hơn, thậm chí sớm hơn, nếu nó đã có sẵn cho tôi; Tôi hy vọng điều tương tự cũng đúng với nhiều người - vì vậy lập luận rằng nó ít được sử dụng dường như là một trong những cơ hội.
Mặc dù có thể tránh hồi quy nhị thức âm, (bằng cách sử dụng các mô hình Poisson quá mức), hoặc một số tình huống thực sự không quan trọng lắm với những gì bạn làm , có nhiều lý do tại sao điều đó không hoàn toàn thỏa đáng.
Ví dụ: khi mối quan tâm của tôi thiên về các khoảng dự đoán hơn là ước tính các hệ số, thì thực tế là các hệ số không thay đổi có thể không phải là một lý do thích hợp để tránh nhị thức âm.
Tất nhiên, vẫn còn những lựa chọn khác mô hình hóa sự phân tán (chẳng hạn như Conway-Maxwell-Poisson là chủ đề của bài báo mà bạn đề cập); trong khi đó là những lựa chọn chắc chắn, đôi khi có những tình huống tôi khá vui khi nhị thức âm là một "phù hợp" hợp lý như là một mô hình cho vấn đề của tôi.
Có phải tất cả những sử dụng và khuyến nghị trong lỗi?
Tôi thực sự không nghĩ như vậy! Nếu họ là như vậy, nó đã trở nên rõ ràng hợp lý cho đến bây giờ. Thật vậy, nếu McCullagh và Nelder tiếp tục cảm thấy như vậy, họ không thiếu cơ hội, cũng không thiếu diễn đàn để làm rõ các vấn đề còn lại. Nelder đã qua đời (2010), nhưng McCullagh rõ ràng vẫn còn ở đây .
Nếu đoạn văn ngắn đó trong McCullagh và Nelder là tất cả những gì họ có, tôi sẽ nói đó là một cuộc tranh luận khá yếu.
Hậu quả của liên kết có vấn đề này là gì?
Tôi nghĩ vấn đề này chủ yếu là một trong các hàm phương sai và hàm liên kết có liên quan chứ không liên quan (như trường hợp của hầu hết các họ GLM chính khác được sử dụng phổ biến), điều này làm cho việc giải thích theo thang đo của bộ dự báo tuyến tính ít đơn giản hơn (điều đó không có nghĩa là vấn đề duy nhất; tôi nghĩ đó là vấn đề chính của một học viên). Đó không phải là một thỏa thuận nhiều.
Bằng cách so sánh, tôi thấy các mô hình Tweedie được sử dụng rộng rãi hơn trong thời gian gần đây và tôi không thấy mọi người liên quan đến mình với thực tế là xuất hiện cả trong chức năng phương sai và liên kết chính tắc (trong hầu hết các trường hợp thậm chí còn đáng lo ngại về liên kết chính tắc).p
Không có gì trong số này là lấy đi bất cứ thứ gì từ các mô hình Conway-Maxwell-Poisson (chủ đề của bài viết Người bán và Shmueli), cũng đang được sử dụng rộng rãi hơn - Tôi chắc chắn không muốn tham gia vào một nhị thức âm so với COM Trận đấu bắn -Poisson.
Tôi chỉ đơn giản là không xem nó là cái này hay cái khác, hơn bất kỳ (bây giờ nói rộng rãi hơn) Tôi có lập trường thuần túy Bayesian hoặc hoàn toàn không thường xuyên về các vấn đề thống kê. Tôi sẽ sử dụng bất cứ điều gì khiến tôi trở thành sự lựa chọn tốt nhất trong những hoàn cảnh cụ thể mà tôi gặp phải và mỗi lựa chọn có xu hướng có những ưu điểm và nhược điểm.