Giúp tôi hiểu giá trị


13

Tôi đang cố gắng để chạy một logit Bayes trên dữ liệu ở đây . Tôi đang sử dụng bayesglm()trong armgói trong R. mã hóa là đủ đơn giản:

df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)

summary(model) đưa ra đầu ra sau:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.10381    0.10240   1.014    0.311    
SEXMale      0.02408    0.09363   0.257    0.797    
HIGH        -0.27503    0.03562  -7.721 1.15e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2658.2  on 1999  degrees of freedom
Residual deviance: 2594.3  on 2000  degrees of freedom
AIC: 2600.3

Xin hãy dẫn tôi qua đây. Tôi hiểu rằng mã này sử dụng trước rất yếu (vì tôi không chỉ định các phương tiện trước) nên đầu ra sẽ thực tế giống như vậy nếu tôi sử dụng glm()thay vì bayesglm(). Nhưng đầu ra vẫn phải theo tinh thần Bayes, phải không? Giá trị và giá trị z ở đây là gì? Không phải là những công cụ suy luận thường xuyên? Có phải họ giải thích khác nhau ở đây?pz


Đây là một nhận xét và không phải là một câu trả lời, nhưng đây là những gì sẽ có ý nghĩa với tôi. Bạn nhận được các ước tính có thể là các giá trị mà phân phối sau được tối đa hóa. Cũng có thể chúng chỉ là phương tiện của hậu thế? Đáng để kiểm tra nếu bạn có thể. Nhưng bất kể chi tiết chính xác là gì, một khi bạn có một số ước tính, bạn có thể kiểm tra chúng bằng Ước tính / Std thông thường. Lỗi -> quy trình điểm z hoạt động nếu hậu thế đủ gần với mức bình thường (nó đi đến mức bình thường trong một số điều kiện thường giữ).
Erik

Erik ... Bạn đã đúng: các hệ số thực sự là phương tiện của mật độ sau. Câu hỏi của tôi là về các giá trị p và z. Họ đại diện cho cái gì ở đây?
dùng3671

Đồng ý. Nếu bạn có mật độ xấp xỉ phân phối bình thường, bạn có thể kiểm tra xem giá trị của nó có bằng 0 hay không bằng cách lấy z-points = mean / độ lệch chuẩn của phân phối và so sánh nó với phân phối chuẩn thông thường. Sau đó, bạn xem giá trị của bạn hoặc giá trị lớn hơn sẽ không nằm trong phân phối chuẩn thông thường -> giá trị p. Xem điểm z trên Wikipedia để biết chi tiết.
Erik

Vâng, vâng. Nhưng tại sao phải làm điều đó trong một khung cảnh Bayes? Trong suy luận Bayes, ước tính điểm là phỏng đoán tốt nhất của tôi về tham số ngẫu nhiên, do đó không cần phải kiểm tra nó. Nhiều nhất, tôi có thể bao gồm một "khoảng tin cậy" tương đương với "khoảng tin cậy" thường xuyên nhưng có cách giải thích thống kê rất khác nhau. Đây là phần khó hiểu về đầu ra tóm tắt (). Tinh thần là Bayes, nhưng đầu ra là thường xuyên?
dùng3671

Một điểm là ước tính bạn nhận được sẽ khác nhau, vì bạn đã sử dụng trước đó. Và trong khi ước tính điểm là "dự đoán tốt nhất" nếu bạn muốn hiển thị theo cách Bayes rằng một cái gì đó có hiệu ứng bạn sẽ cố gắng chỉ ra rằng khoảng tin cậy không chứa số không. Khi bạn ước tính mức sau bằng một giá trị bình thường có cùng giá trị trung bình và sd (chính xác không có triệu chứng) thì khoảng tin cậy (1-p / 2) là khoảng tin cậy đối xứng lớn nhất chứa 0, vì vậy câu trả lời của bạn về cơ bản là giống nhau. Giá trị p là giá trị p đã nêu ở trên.
Erik

Câu trả lời:


16

Câu hỏi tuyệt vời! Mặc dù có các giá trị p của Bayes và một trong những tác giả của gói arm là một người ủng hộ, những gì bạn đang thấy trong đầu ra của bạn không phải là giá trị p của Bayes. Kiểm tra lớp củamodel

class(model)
"bayesglm" "glm"      "lm" 

và bạn có thể thấy lớp bayesglm kế thừa từ glm. Hơn nữa, kiểm tra gói cánh tay cho thấy không có phương pháp tóm tắt cụ thể nào cho một đối tượng bayesglm. Vì vậy khi bạn làm

summary(model)

bạn đang thực sự làm

summary.glm(model)

và nhận được sự giải thích thường xuyên về kết quả. Nếu bạn muốn có một phối cảnh Bayes hơn, chức năng trong tay làdisplay()


+1 câu trả lời tuyệt vời! Đây là rắc rối với R, có rất nhiều nhà thống kê rất thông minh đã viết mã khủng khiếp để lại những loại mìn này nằm xung quanh.
Bogdanovist

Nó có vẻ như là một sự lựa chọn có chủ ý về phía các nhà thiết kế, hơn là một sự giám sát.
atiretoo - phục hồi monica

Sau khi đọc liên kết, tôi đồng ý với ý định đó, nhưng trong trường hợp đó, tóm tắt () nên được thực hiện lại để chỉ gọi hiển thị () thay vì đưa ra kết quả vô nghĩa mà không có cảnh báo. Người hỏi câu hỏi này đã vấp phải một mã phá vỡ mô hình người dùng cho R đã được thiết lập bởi mọi đối tượng khác mà họ từng sử dụng. Đó là thực hành lập trình khủng khiếp.
Bogdanovist

2
Rất cám ơn, atiretoo. Điều này đặt ra một câu hỏi khác. Sự khác biệt giữa display () và Tóm tắt () là gì? Dường như với tôi rằng đầu ra từ cái trước chỉ là đầu ra từ cái sau, ít hơn hai cột và được làm tròn thành 2 chữ số. Nó sẽ xuất hiện như vậy, từ bài đăng của Gelman bạn đã liên kết ở trên.
dùng3671

Vâng, và từ cuộc thảo luận tại blog của Andrew Gelman, có vẻ như họ sẽ sửa lỗi này trong các phiên bản tương lai của gói arm.
atiretoo - phục hồi monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.