phân tán trong tóm tắt.glm ()

13

Tôi đã tiến hành một glm.nb bởi

glm1<-glm.nb(x~factor(group))

với nhóm là một thể loại và x là một biến số. Khi tôi cố gắng để có được bản tóm tắt kết quả, tôi nhận được kết quả hơi khác nhau, tùy thuộc vào việc tôi sử dụng summary()hay summary.glm. summary(glm1)đưa cho tôi

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

trong khi tóm tắt.glm (glm1) mang lại cho tôi

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Tôi hiểu ý nghĩa của tham số phân tán, nhưng không phải của dòng

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

Trong cuốn sổ tay có ghi, nó sẽ là độ phân tán ước tính, nhưng dường như đó là một ước lượng xấu, vì 0,95 không gần với 0,7109, hay là độ phân tán ước tính có gì khác so với tham số phân tán ước tính? Tôi đoán, tôi phải đặt độ phân tán trong summary.nb(x, dispersion=)một cái gì đó, nhưng tôi không chắc chắn, nếu tôi phải đặt độ phân tán thành 1 (sẽ mang lại kết quả tương tự summary()hoặc nếu tôi nên chèn ước tính của tham số phân tán, trong trường hợp này dẫn đến summary.nb(glm1, dispersion=0.7109)hoặc cái gì khác? Hoặc tôi ổn với việc chỉ sử dụng summary(glm1)?

r generalized-linear-model negative-binomial

— Renoir Pulitz
nguồn

2

Sử dụng tóm tắt () khi nó gửi đến phương thức S3 thích hợp cho lớp phủ âm. Sự phân tán tất nhiên phải là 1, cái được ước tính là theta, tốt hơn được gọi là tham số hình dạng để tránh nhầm lẫn. Xem thêm thống kê.stackexchange.com/questions/27773 / how

— Momo

13

Thứ nhất, bạn không nên sử dụng summary.glmtrên một đối tượng của lớp "negbin". Nếu bạn nhìn vào mã chức năng summary.glm, ngay trên đầu bạn sẽ thấy tính toán của dispersion. Lưu ý rằngsummary.glm glm $\phi$ $\phi$ family mô hình được trang bị bởi glm.nblà "Negative Binomial(theta)". Do đó khi bạn sử dụngsummary.glmtrên mô hình được trang bị bởi glm.nb, mã trong

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial" $\phi$ summary.negbin

$\phi$ dispersion .

Thứ hai, bạn hiểu sai về đầu ra. Khi bạn thấy

Negative Binomial(0.7109)

$\hat{\theta}$ $\phi$ , tham số phân tán, và do đó hai số không nên nhất thiết phải bình đẳng; chúng chỉ là hai số.

$\phi$ $\phi = 1$ summary.negbin

summary(glm1, dispersion = 0.9509)

và nhận được đầu ra bổ sung mà negbin $\phi$

— Phục hồi Monica - G. Simpson
nguồn

5

+1 Giải thích hay. Tôi có hai nhận xét nhỏ: Tham số phân tán trong nhị thức, Poisson và nhị thức âm với tham số hình dạng đã biết là 1 theo định nghĩa của họ hàm mũ (nó không phải là giả định). Khi bạn nói rằng một sự phân tán khác nhau có thể được ước tính và cung cấp cho phương pháp tóm tắt thì người ta phải cẩn thận vì người ta sẽ mạo hiểm vào lãnh thổ gần như có ý nghĩa đặc biệt đối với khả năng.

— Momo

@Momo Nói hay quá. Tôi đã bị giằng xé giữa những gì bạn nêu và các chi tiết của trang trợ giúp cho các chức năng tương ứng.

— Phục hồi Monica - G. Simpson

2

$\theta$ $\frac{1}{\theta}$ $1$ $\frac{1}{\theta}$ $E$ $Y$ $E$ $\mu E$ $\mu$

f (y) = \frac{Γ (θ + y)}{Γ (θ) y!} \cdot \frac{μ^{y} θ^{θ}}{(μ + θ)^{θ + y}}

$f(y)=\frac{\Gamma(\theta +y)}{\Gamma(\theta) y!}\cdot\frac{\mu^y \theta^\theta}{(\mu+\theta)^{\theta+y}}$

sự mong đợi

E Y = μ

$\operatorname{E}Y=\mu$

& phương sai

Var Y = μ + \frac{μ^{2}}{θ}

$\operatorname{Var} Y = \mu +\frac{\mu^2}{\theta}$

Như @Momo chỉ ra, tham số phân tán là một thứ hoàn toàn khác, mà bạn cho phép thay đổi để thực hiện ước lượng gần đúng. Đối với mô hình nhị thức âm & mô hình Poisson (đúng), nó được cố định đúng với giá trị của một.

— Scortchi - Phục hồi Monica
nguồn