Theta trong hồi quy nhị thức âm được trang bị R là gì?


26

Tôi có một câu hỏi liên quan đến hồi quy nhị thức âm: Giả sử rằng bạn có các lệnh sau:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Lưu ý rằng ô tô là một bộ dữ liệu có sẵn trong R và tôi không thực sự quan tâm nếu mô hình này có ý nghĩa.)

Điều tôi muốn biết là: Làm thế nào tôi có thể diễn giải biến theta(như được trả lại ở cuối cuộc gọi đến summary). Đây có phải là tham số hình dạng của phân phối negbin và có thể giải thích nó như là một thước đo độ lệch?


Một bản tóm tắt về những gì MASS nói ở đây .
Scortchi - Tái lập Monica

Câu trả lời:


17

Có, thetalà tham số hình dạng của phân phối nhị thức âm, và không, bạn thực sự không thể hiểu nó là thước đo độ lệch. Chính xác hơn:

  • độ lệch sẽ phụ thuộc vào giá trị của theta, nhưng cũng phụ thuộc vào giá trị trung bình
  • không có giá trị thetanào sẽ đảm bảo bạn thiếu xiên

Nếu tôi không làm hỏng nó, trong mu/ thetatham số được sử dụng trong hồi quy nhị thức âm, độ lệch là

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

Trong bối cảnh này, thường hiểu như là một biện pháp overdispersion liên quan đến việc phân phối Poisson với. Phương sai của các nhị thức tiêu cực là μ + μ 2 / θ , vì vậy θ thực sự kiểm soát sự thay đổi vượt quá so với Poisson (đó sẽ là μ ), và không phải là nghiêng.θμ+μ2/θθμ


cảm ơn cho đến nay Đây là sự trợ giúp tốt ... Nhưng: Làm thế nào tôi có thể diễn giải các giá trị cao hoặc (thấp) của theta? Trong cuốn sách của McCaullaughs, các mô hình tuyến tính tổng quát có một liên kết đến bài báo này từ anscombe để đưa ra giải thích về k. Nhưng thật không may, tôi không thực sự hiểu nó. Bài viết là claremontmckenna.edu/facultysites/math/FacMember/MOneill/
Kẻ

Bạn chỉ cần đọc trang đầu tiên. Vì vậy, theta (hoặc k trong anscombe) là tham số hình dạng của phân phối negbin và nó quản lý, nếu phân phối gần với gamma (k -> 0) hoặc poisson (k -> vô cùng). Nhưng nó có nghĩa gì cho phù hợp? Làm thế nào tôi có thể giải thích theta ví dụ cho ước tính xe hơi?
MarkDollar

33

Tôi đã được một trong những học sinh của mình giới thiệu đến trang web này trong khóa học về Số lượng mô hình . Dường như có rất nhiều thông tin sai lệch về mô hình nhị thức âm, và đặc biệt là liên quan đến tham số thống kê và phân tán.

μglmglm.nb θ

glm.nbglmμ+μ2θμ+αμ2glm.nbglmglm.nbRõ ràng đã lấy mối quan hệ gián tiếp từ McCullagh & Nelder, nhưng Nelder (người đồng sáng lập GLM năm 1972) đã viết phần bổ sung hệ thống kk của mình cho Genstat vào năm 1993, trong đó ông cho rằng mối quan hệ trực tiếp được ưa thích. Anh ấy và vợ thường đến thăm tôi và gia đình tôi mỗi năm ở Arizona bắt đầu từ đầu năm 1993 cho đến năm trước khi anh ấy chết. Chúng tôi đã thảo luận vấn đề này khá kỹ lưỡng, vì tôi đã đặt mối quan hệ trực tiếp vào chương trình glm mà tôi đã viết vào cuối năm 1992 cho phần mềm Stata và Xplore, và cho một macro của SAS vào năm 1994.

nbinomialαθnbinomial


2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"hình dạng" - cái sau mà tôi không thấy bất hợp lý vì nó chắc chắn ảnh hưởng đến hình dạng.
Momo

Phạm vi của theta là gì? Có theta phải là một giá trị lớn hơn một?
News_is_Selection_Bias

2

glm tham chiếu nhị thức âm tính: nhập mô tả hình ảnh ở đây

Wikipedia nhị thức âm 'r' là glm '' theta 'ngụ ý glm' theta 'là tham số hình dạng. Nói một cách đơn giản, 'theta' của glm là số lần thất bại.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.