Nó sẽ đi quá xa để nói rằng nó xác nhận sự lựa chọn phân phối của tôi?
Nó phụ thuộc vào ý nghĩa của bạn bằng cách 'xác thực' chính xác, nhưng tôi nói 'vâng, điều đó đi quá xa' giống như cách bạn không thể thực sự nói "null được thể hiện là đúng", (đặc biệt là với điểm null, nhưng ít nhất là theo nghĩa nào đó nói chung hơn). Bạn chỉ có thể thực sự nói "tốt, chúng tôi không có bằng chứng mạnh mẽ rằng nó sai". Nhưng trong mọi trường hợp, chúng tôi không hy vọng mô hình của mình hoàn hảo, chúng là mô hình . Điều quan trọng, như Box & Draper đã nói, là " họ đã sai đến mức nào để không hữu ích? "
Một trong hai câu trước:
Điều này dường như gợi ý (với tôi) rằng việc lựa chọn phân phối Gaussian là khá hợp lý. Hoặc, ít nhất, phần dư phù hợp với phân phối tôi đã sử dụng trong mô hình của mình.
mô tả chính xác hơn nhiều những gì chẩn đoán của bạn chỉ ra - không phải mô hình Gaussian với liên kết nhật ký là đúng - mà là hợp lý hoặc phù hợp với dữ liệu.
Tôi đã chọn một hàm liên kết nhật ký vì biến phản hồi của tôi luôn dương, nhưng tôi muốn một số xác nhận rằng đó là một lựa chọn tốt.
Nếu bạn biết nó phải tích cực thì ý nghĩa của nó phải tích cực. Thật hợp lý khi chọn một mô hình ít nhất phù hợp với điều đó. Tôi không biết liệu đó có phải là một lựa chọn tốt hay không (cũng có thể có nhiều lựa chọn tốt hơn), nhưng đó là một điều hợp lý để làm; nó cũng có thể là điểm khởi đầu của tôi [Tuy nhiên, nếu bản thân biến đó nhất thiết là dương, thì suy nghĩ đầu tiên của tôi sẽ có xu hướng là Gamma với log-link, thay vì Gaussian. "Nhất thiết phải tích cực" không cho thấy cả độ lệch và phương sai thay đổi theo giá trị trung bình.]
Câu hỏi 2: Có bất kỳ thử nghiệm nào, như kiểm tra phần dư cho sự lựa chọn phân phối, có thể hỗ trợ cho sự lựa chọn của tôi về chức năng liên kết không?
Có vẻ như bạn không có nghĩa là 'kiểm tra' như trong "kiểm tra giả thuyết chính thức" mà là 'kiểm tra chẩn đoán'.
Trong cả hai trường hợp, câu trả lời là, có, có.
Một thử nghiệm giả thuyết chính thức là Độ tốt của kiểm tra liên kết của Pregibon [1].
Điều này dựa trên việc nhúng chức năng liên kết trong họ Box-Cox để thực hiện kiểm tra giả thuyết về tham số Box-Cox.
Xem thêm cuộc thảo luận ngắn gọn về thử nghiệm của Pregibon tại Breslow (1996) [2] ( xem trang 14 ).
Tuy nhiên, tôi thực sự khuyên bạn nên gắn bó với lộ trình chẩn đoán. Nếu bạn muốn kiểm tra chức năng liên kết, về cơ bản bạn sẽ khẳng định rằng trên thang đo liên kết,η= g( μ ) là tuyến tính trong xĐó là trong mô hình, vì vậy một đánh giá cơ bản có thể xem xét một lô dư so với các dự đoán. Ví dụ,
dư lượng làm việc rWTôi= ( yTôi- μ^Tôi) ( ∂η∂μ)
(mà tôi muốn hướng nạc cho đánh giá này), hoặc có lẽ bằng cách nhìn vào độ lệch từ tuyến tính trong dư một phần, với một cốt truyện cho từng dự đoán (xem ví dụ, Hardin và Hilbe, Generalized tuyến tính mô hình và phần mở rộng, ed 2. giây 4.5 .4 p54, cho định nghĩa),
rTk tôi= ( yTôi- μ^Tôi) ( ∂η∂μ) + xtôi kβ^k
= rWTôi+ xtôi kβ^k
Trong trường hợp dữ liệu thừa nhận chuyển đổi bằng chức năng liên kết, bạn có thể tìm kiếm tuyến tính theo cùng kiểu với hồi quy tuyến tính (mặc dù bạn đã để lại độ lệch và có thể không đồng nhất).
Trong trường hợp của các yếu tố dự đoán phân loại, việc lựa chọn chức năng liên kết là vấn đề thuận tiện hoặc dễ hiểu hơn, sự phù hợp phải giống nhau (vì vậy không cần phải đánh giá cho chúng).
Bạn cũng có thể căn cứ chẩn đoán theo cách tiếp cận của Pregibon.
Chúng không tạo thành một danh sách đầy đủ; bạn có thể tìm thấy các chẩn đoán khác được thảo luận.
[Điều đó nói rằng, tôi đồng ý với đánh giá của gung rằng việc lựa chọn chức năng liên kết ban đầu nên dựa trên những điều như cân nhắc lý thuyết, khi có thể.]
Xem thêm một số cuộc thảo luận trong bài viết này , ít nhất là một phần có liên quan.
[1]: Pregibon, D. (1980),
"Mức độ tốt của các thử nghiệm liên kết đối với các mô hình tuyến tính tổng quát",
Tạp chí của Hiệp hội thống kê Hoàng gia. Sê-ri C (Thống kê ứng dụng) ,
Tập. 29, số 1, trang 15-23.
[2]: Breslow NE (1996),
"Các mô hình tuyến tính tổng quát: Kiểm tra các giả định và củng cố kết luận,"
Statistica Applicata 8 , 23-41.
pdf