Tôi đang đề cập đến câu hỏi và câu trả lời của nó: Làm thế nào để so sánh khả năng dự đoán (xác suất) của các mô hình được phát triển từ hồi quy logistic? bởi @Clark Chong và câu trả lời / bình luận của @Frank Harrell. và cho câu hỏi bậc tự do của trong thử nghiệm Hosmer-Lemeshow và ý kiến.
Tôi đã đọc bài báo DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "So sánh các bài kiểm tra mức độ phù hợp cho mô hình hồi quy Logistic", Statistics in Medicine, Vol. 16, 965-980 (1997) .
Sau khi đọc, tôi đã bối rối vì câu hỏi mà tôi đề cập đến hỏi một cách rõ ràng về "khả năng dự đoán (xác suất)", theo ý kiến của tôi không giống như những gì các bài kiểm tra mức độ phù hợp trong bài kiểm tra trên giấy nhắm đến:
Như hầu hết chúng ta đều biết, hồi quy logistic giả định một liên kết hình chữ S giữa các biến giải thích và xác suất thành công, dạng hàm cho hình dạng S là
Không giả vờ rằng không có thiếu sót nào với bài kiểm tra Lemmerow của Lemmer, tôi nghĩ rằng chúng ta phải phân biệt giữa các bài kiểm tra về khả năng dự đoán (a) '(xác suất) ' và (b) ' mức độ phù hợp '.
Mục tiêu của người tạo mẫu là kiểm tra xem xác suất có được dự đoán tốt hay không, trong khi kiểm tra mức độ phù hợp kiểm tra xem hàm hình chữ S ở trên có phải là hàm 'phải' hay không. Chính thức hơn:
Rõ ràng, nếu chức năng trên có dạng chức năng 'đúng' (vì vậy nếu các thử nghiệm kết luận rằng chúng tôi có thể chấp nhận
Nhận xét đầu tiên
Câu hỏi đầu tiên
Câu hỏi / nhận xét quan trọng nhất mà tôi có là nếu lòng tốt của phù hợp
Câu hỏi thứ hai
Hơn nữa, tôi muốn chỉ ra kết luận của Hosmer et. al; (Tôi trích dẫn từ bản tóm tắt):
'' Một cuộc kiểm tra về hiệu suất của các bài kiểm tra khi mô hình chính xác có thuật ngữ bậc hai nhưng một mô hình chỉ chứa thuật ngữ tuyến tính đã phù hợp cho thấy Pearson chi-vuông, tổng bình phương không trọng số, decile Hosmer-Lemeshow về rủi ro, phép tính tổng bình phương còn lại được làm mịn và kiểm tra điểm số của Stukel, có công suất vượt quá 50% để phát hiện sự khởi hành vừa phải từ tuyến tính khi kích thước mẫu là 100 và có sức mạnh trên 90% đối với các phương án tương tự cho các mẫu có kích thước 500 Tất cả các thử nghiệm không có sức mạnh khi mô hình chính xác có tương tác giữa hiệp phương sai và liên tục nhưng chỉ có mô hình hiệp biến liên tục là phù hợp. Khả năng phát hiện một liên kết được chỉ định không chính xác là kém đối với các mẫu có kích thước 100. Đối với các mẫu có kích thước 500 Stukel ' Kiểm tra điểm số có sức mạnh tốt nhất nhưng nó chỉ vượt quá 50% để phát hiện chức năng liên kết không đối xứng. Sức mạnh của bài kiểm tra tổng bình phương không trọng số để phát hiện hàm liên kết được chỉ định không chính xác ít hơn một chút so với bài kiểm tra điểm của Stukel ''
Tôi có thể kết luận từ bài kiểm tra nào có nhiều sức mạnh hơn không hoặc rằng Lemmer Lem Lemowow có ít sức mạnh hơn (để phát hiện những bất thường cụ thể này)?
Nhận xét thứ hai