Làm thế nào để diễn giải thuật ngữ chặn trong GLM?


20

Tôi đang sử dụng R và tôi đã phân tích dữ liệu của mình bằng GLM với liên kết Binomial.

Tôi muốn biết ý nghĩa của việc chặn trong bảng đầu ra là gì. Việc chặn cho một trong các mô hình của tôi là khác nhau đáng kể, tuy nhiên biến thì không. Điều đó có nghĩa là gì?

Đánh chặn là gì. Tôi không biết nếu tôi chỉ bối rối bản thân mình nhưng đã tìm kiếm trên internet, không có gì chỉ để nói, đây là, hãy chú ý đến nó ... hoặc không.

Xin hãy giúp đỡ, một sinh viên rất thất vọng


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5

1
Hàm liên kết mà bạn chỉ định trong glm là gì?
Tomas

5
Chặn là giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập là 0. Không có thêm thông tin về mô hình của bạn, tôi không thể nói liệu điều này có ý nghĩa trong trường hợp của bạn hay không.
Peter Flom - Tái lập Monica

Câu trả lời:


21

Thuật ngữ đánh chặn là đánh chặn ở phần tuyến tính của phương trình GLM, vì vậy mô hình của bạn cho giá trị trung bình là , nơi g là chức năng liên kết của bạn và X β là mô hình tuyến tính của bạn. Mô hình tuyến tính này chứa một "thuật ngữ chặn", nghĩa là:E[Y]=g1(Xβ)gXβ

Xβ=c+X1β1+X2β2+

Trong trường hợp của bạn, phần chặn là đáng kể khác không, nhưng biến thì không, vì vậy nó nói rằng

Xβ=c0

Bởi vì chức năng liên kết của bạn là nhị thức, sau đó

g(μ)=ln(μ1μ)

Và do đó, chỉ với thuật ngữ chặn, mô hình được trang bị cho giá trị trung bình của bạn là:

E[Y]=11+ec

Bạn có thể thấy rằng nếu thì điều này tương ứng với cơ hội 50:50 nhận được Y = 1 hoặc 0, tức là E [ Y ] = 1c=0E[Y]=11+1=0.5

Vì vậy, kết quả của bạn nói rằng bạn không thể dự đoán kết quả, nhưng một lớp (1 hoặc 0) có nhiều khả năng hơn lớp kia.


2
Bạn làm tôi sợ ở E [Y] = .... :). Cảm ơn bạn đã trả lời, tôi (loại) hiểu những gì bạn đang nói. Bạn nói rằng đánh chặn là sig. khác không, nhưng var. không phải, nó là p = 1,00!? Các biến p-value có ảnh hưởng gì đến những gì tôi có thể nói về resut?
Samuel Waldron

2
Nếu một biến p-value không nhỏ, thì biến thường không bao gồm biến đó trong mô hình. Trong trường hợp của bạn, biến thậm chí không được ước tính có giá trị khác không, do đó giá trị p là 1,00. Về cơ bản, không có mối quan hệ nào giữa "điều trị" và "bị tấn công_excluding_app". Sự vắng mặt của mối quan hệ là hoàn hảo đến mức gần như nghi ngờ, mặc dù bạn có một bộ dữ liệu nhỏ. Có thể đáng để trực quan hóa dữ liệu của bạn và xem liệu nó có hợp lý không.
Corone

2
+1 cho câu trả lời, (và gợi ý trong nhận xét rằng có điều gì đó kỳ lạ đang xảy ra trong tập dữ liệu) mặc dù tôi không đồng ý với việc mở bình luận của bạn "Nếu một biến p-value không nhỏ, thì thông thường sẽ không bao gồm biến đó trong mô hình." Điều này không nhất thiết phải như vậy - thường người ta muốn báo cáo mức độ quan trọng của mối quan hệ, ngay cả khi nó không "quan trọng" (và hơn thế nữa, nếu bạn quan tâm đến việc mô hình hóa một mối quan hệ để bắt đầu, thì kết quả không có giá trị là vẫn quan trọng để báo cáo.)
James Stanley

1
@James - Điểm rất hay, người ta phải luôn báo cáo những biến bạn đã kiểm tra - Tôi nên rõ ràng hơn, tôi chỉ có nghĩa là người ta thường không bao gồm biến đó khi cố gắng sử dụng mô hình để đưa ra dự báo (vì nó thường có nghĩa là quá mức ).
Corone

@Corone - Tôi đặc biệt quan tâm đến nhận xét của bạn ở đây về biến / loại trừ và mối quan hệ của chúng với chuỗi tại stats.stackexchange.com/questions/17624/ Lỗi
rolando2

5

Dường như với tôi có thể có một số vấn đề với dữ liệu. Điều kỳ lạ là ước tính tham số cho hệ số sẽ là 0,000. Có vẻ như cả DV và IV của bạn đều phân đôi và tỷ lệ DV của bạn không khác nhau chút nào với IV của bạn. Thê nay đung không?

Việc chặn, như tôi đã lưu ý trong nhận xét của mình (và như câu trả lời của @corone ngụ ý) là giá trị của DV khi IV bằng 0. IV của bạn được mã hóa như thế nào? Mặc dù vậy, thực tế là ước tính cho hệ số là 0,000 ngụ ý rằng IV không có sự khác biệt.

log(p1p)


Chào các bạn, một lần nữa cảm ơn các bạn đã cho ý kiến. Các điểm dữ liệu gần như giống hệt nhau. Tôi đang báo cáo nó trong một báo cáo và dù sao cũng phải làm nổi bật nó. Đây là lý do tại sao kết quả trông kỳ lạ. Với dữ liệu này (GLM) và các bộ dữ liệu khác trong các báo cáo của tôi (GLMM), tôi đang chạy một cách chắc chắn (# TEAM2x2x2x2) trước khi tôi có thể đi bộ. Tôi nghĩ vấn đề chính của tôi là biết những gì tôi cần báo cáo, tôi có đề cập đến các số liệu thống kê cho việc đánh chặn hoặc cho IV không? Dưới đây là GLMM (hy vọng tiêu chuẩn hơn) của tôi một lần nữa với liên kết nhị thức.
Samuel Waldron

Mô hình hỗn hợp tuyến tính tổng quát phù hợp với Công thức xấp xỉ Laplace: Tấn công ~ Điều trị + Thử nghiệm + Điều trị * Thử nghiệm + (1 | Chim) Dữ liệu: dữ liệu AIC BIC logLik deviance 139.6 153.8 -64.78 129.6 Hiệu ứng ngẫu nhiên: Tên nhóm Phương sai Std.Dev. Chim (Đánh chặn) 0.87795 0.93699 Số lượng quan sát: 128, nhóm: Chim, 32
Samuel Waldron

Hiệu ứng cố định: Ước tính Std. Lỗi z giá trị Pr (> | z |) (Chặn) 3.19504 0.90446 3.533 .000412 *** Treatmentshiny_non-Shiny 0.02617 1.26964 0.021 .983558 Thử nghiệm -1.53880 0.36705 -4.192 2.76e-05 *** Điều trị: Thử nghiệm 0.16909 --- Dấu hiệu. mã: 0 ' ' 0,001 ' ' 0,01 ' ' 0,05 '.' 0,1 '' 1 Tương quan của các hiệu ứng cố định: (Intr) Trtm_- Thử nghiệm Trtmntshn_- -0.712 Thử nghiệm -0.895 0.638 Trtmnts _-: T 0.664 -0.896 -0.742
Samuel Waldron

3

Trong trường hợp của bạn, chặn là trung bình lớn attacked_excluding_app, được tính cho tất cả dữ liệu bất kể treatment. Kiểm tra ý nghĩa trong bảng hệ số là kiểm tra xem nó có khác biệt đáng kể so với không. Điều này có liên quan hay không phụ thuộc vào việc bạn có lý do tiên nghiệm nào đó để mong đợi nó bằng không hay không.

Ví dụ, hãy tưởng tượng bạn đã thử một loại thuốc và giả dược về tác dụng của chúng đối với huyết áp. Đối với mỗi đối tượng, bạn ghi lại sự thay đổi huyết áp của họ bằng cách tính toán (áp lực sau điều trị - áp lực trước khi điều trị) và coi đây là biến phụ thuộc trong phân tích của bạn. Sau đó, bạn thấy rằng hiệu quả của điều trị (thuốc so với giả dược) là không đáng kể nhưng việc đánh chặn là đáng kể> 0 - điều này sẽ cho bạn biết rằng trung bình, huyết áp của đối tượng của bạn tăng lên giữa hai lần đo. Điều này có thể thú vị và cần điều tra thêm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.