Khả năng Nhật ký -2 có thể được tính chỉ với một mô hình không?


9

Tôi đang sử dụng glmfitchức năng trong MATLAB. Hàm chỉ trả về độ lệch và không có khả năng đăng nhập. Tôi hiểu rằng độ lệch về cơ bản là gấp đôi sự khác biệt giữa khả năng đăng nhập của các mô hình nhưng điều tôi không nhận được là tôi chỉ sử dụng glmfitđể tạo một mô hình, nhưng bằng cách nào đó tôi đang bị lệch.

  • Không tính toán khả năng Nhật ký -2 yêu cầu 2 mô hình?
  • Làm thế nào có thể phân tích sai lệch khi chỉ có một mô hình?

Một câu hỏi khác mà tôi đang có là tôi đã có hai mô hình và tôi đã so sánh chúng bằng cách sử dụng thử nghiệm khả năng đăng nhập. Giả thuyết khống sẽ là mô hình đầu tiên và giả thuyết thay thế sẽ là mô hình thứ hai. Sau khi nhận được thống kê kiểm tra khả năng đăng nhập, tôi sẽ kiểm tra nó dựa trên cdf chi bình phương để xác định giá trị p? Tôi có đúng không nếu nó nhỏ hơn mức alpha tôi sẽ từ chối null và nếu lớn hơn tôi sẽ không từ chối null?


2
Cho câu hỏi đầu tiên của bạn. Có 2 mô hình. Một mô hình khác là một mô hình hoàn hảo với khả năng đăng nhập = 0. Theo cách này, độ lệch của bạn chỉ bằng khả năng nhật ký của mô hình.
FMZ

1
nó sẽ là mô hình hoàn hảo - mô hình của tôi, hay mô hình của tôi - mô hình hoàn hảo? Và việc chia nó cho -2 có thực sự mang lại cho tôi khả năng đăng nhập của mô hình và tôi có thể sử dụng điều đó để thực hiện kiểm tra khả năng đăng nhập không?
shiu6rewgu

Câu trả lời:


13

D(y)=2log{p(y|θ^)},
θ^y

D(y,θ^)=2log{p(y|θ^)}
yθ^1θ^2
2(log{p(y|θ^1)}log{p(y|θ^2)}).
glmfit()

glmfit()θ^1θ^s

Y={y1,y2,,yN}

DEV(θ^1,Y)=2[logp(Y|θ^1)logp(Y|θ^s)].
yi giải thích một số ý tưởng để tính toán điều này ... nhưng điều thú vị là trong mọi trường hợp, bạn sẽ cần phải viết ra một hàm tính toán khả năng đăng nhập cho loại dữ liệu của bạn và trong trường hợp đó có lẽ tốt hơn để tạo chức năng của riêng bạn, tính toán khả năng đăng nhập của chính bạn, thay vì quay lại nó ra khỏi phép tính sai lệch.

Xem Chương 6 của Phân tích dữ liệu Bayes để biết một số thảo luận tốt về sự lệch lạc.

Đối với điểm thứ hai của bạn về thống kê kiểm tra khả năng, có vẻ như về cơ bản bạn biết điều phải làm. Nhưng trong nhiều trường hợp, bạn sẽ coi giả thuyết khống là một thứ mà chuyên gia, kiến ​​thức bên ngoài cho phép bạn đoán trước thời hạn (như một số hệ số bằng 0). Đó không nhất thiết là một cái gì đó là kết quả của việc thực hiện mô hình phù hợp.


Cảm ơn bạn! Bạn thực sự đã giúp tôi hiểu những gì lệch lạc là rất nhiều! Tôi vẫn còn một vài câu hỏi, nhưng tôi không biết phải hỏi họ như thế nào. Một khi tôi tìm ra cách để từ nó, tôi chắc chắn sẽ trả lời ở đây.
shiu6rewgu

Ok câu hỏi đầu tiên, làm thế nào tôi có thể trích xuất khả năng đăng nhập cho mô hình mà tôi đã tạo ra từ sự sai lệch khi xem xét rằng matlab chỉ mang lại cho tôi sự sai lệch? Ngoài ra, (tôi biết điều này làm cho tôi trông khá ngu ngốc nhưng) với p (y | θˆ2) sẽ là xác suất nhận được một giá trị y nhất định từ tập dữ liệu kết quả hoặc các biến độc lập được cung cấp tham số được trang bị
shiu6rewgu

Có vẻ như tôi đã nhầm về phương pháp của Matlab. Nó tính toán độ lệch bằng cách nhìn vào hai mô hình và tôi đã chỉnh sửa câu trả lời ở trên để phản ánh điều này.
ely

+1, đây là một câu trả lời thực sự tốt đẹp. Tôi hy vọng sẽ thấy nhiều hơn trong số họ trong tương lai.
gung - Phục hồi Monica

1
@SibbsGambled Trong liên kết này có một ví dụ với dữ liệu cây coolibah hiển thị mô hình "đầy đủ" hoặc "bão hòa" trong đó khả năng đăng nhập không bằng không. Tôi tin rằng có một số tình huống trong đó mô hình bão hòa phải có khả năng theo một định nghĩa, nhưng không phải trong tất cả các tình huống.
ely
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.