Câu trả lời:
Đặt LL = loglikabilities
Dưới đây là một bản tóm tắt nhanh chóng về những gì bạn nhìn thấy từ đầu ra tóm tắt (glm.fit),
Null Deviance = 2 (LL (Mô hình bão hòa) - LL (Mô hình Null)) trên df = df_Sat - df_Null
Độ lệch dư = 2 (LL (Mô hình bão hòa) - LL (Mô hình đề xuất)) df = df_Sat - df_Proposes
Các bão hòa mẫu là một mô hình giả định mỗi điểm dữ liệu có các thông số riêng của mình (có nghĩa là bạn có n thông số để ước lượng.)
Các Null mẫu giả định "đối diện" chính xác, trong đó là giả định một tham số cho tất cả các điểm dữ liệu, có nghĩa là bạn chỉ ước 1 tham số.
Các đề xuất mô hình giả định bạn có thể giải thích các điểm dữ liệu của bạn với p thông số + một thuật ngữ đánh chặn, vì vậy bạn có p + 1 tham số.
Nếu Null Deviance của bạn thực sự nhỏ, điều đó có nghĩa là Mô hình Null giải thích dữ liệu khá tốt. Tương tự như vậy với sự sai lệch còn lại của bạn .
Những gì thực sự nhỏ có nghĩa là gì? Nếu mô hình của bạn là "tốt" thì Deviance của bạn xấp xỉ Chi ^ 2 với mức độ tự do (df_sat - df_model).
Nếu bạn muốn so sánh mô hình Null của bạn với mô hình Đề xuất của bạn, thì bạn có thể xem
(Null Deviance - Residual Deviance) xấp xỉ Chi ^ 2 với df Đề xuất - df Null = (n- (p + 1)) - (n-1) = p
Là kết quả bạn đưa ra trực tiếp từ R? Chúng có vẻ hơi kỳ lạ, bởi vì nhìn chung bạn sẽ thấy rằng mức độ tự do được báo cáo trên Null luôn cao hơn mức độ tự do được báo cáo trên Residual. Đó là bởi vì một lần nữa, Null Deviance df = bão hòa df - Null df = n-1 Residual Deviance df = bão hòa df - Đề xuất df = n- (p + 1)
Độ lệch null cho thấy mức độ đáp ứng được dự đoán bởi mô hình mà không có gì ngoài việc chặn.
Độ lệch còn lại cho thấy mức độ đáp ứng được dự đoán bởi mô hình khi các yếu tố dự đoán được đưa vào. Từ ví dụ của bạn, có thể thấy rằng độ lệch tăng lên 3443.3 khi thêm 22 biến dự đoán (lưu ý: bậc tự do = không có quan sát - không có dự đoán). Sự gia tăng sai lệch này là bằng chứng của sự thiếu phù hợp đáng kể.
Chúng ta cũng có thể sử dụng độ lệch còn lại để kiểm tra xem giả thuyết null có đúng không (tức là mô hình hồi quy Logistic cung cấp mức độ phù hợp cho dữ liệu). Điều này là có thể bởi vì độ lệch được cho bởi giá trị chi bình phương ở một mức độ tự do nhất định. Để kiểm tra mức độ quan trọng, chúng ta có thể tìm ra các giá trị p liên quan bằng cách sử dụng công thức dưới đây trong R:
p-value = 1 - pchisq(deviance, degrees of freedom)
Sử dụng các giá trị trên của độ lệch còn lại và DF, bạn nhận được giá trị p xấp xỉ bằng 0 cho thấy rằng thiếu bằng chứng đáng kể để hỗ trợ cho giả thuyết khống.
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
?