Sự ổn định của mô hình trong việc xác thực chéo các mô hình hồi quy


10

Đưa ra nhiều lần xác thực chéo của hồi quy logistic và kết quả là nhiều ước tính của từng hệ số hồi quy, làm thế nào để đo lường xem một yếu tố dự đoán (hoặc bộ dự đoán) có ổn định và có ý nghĩa hay không dựa trên hệ số hồi quy ? Đây có phải là khác nhau cho hồi quy tuyến tính?


@BGreene Rất thông minh. Tại sao không đăng nó như là một câu trả lời? Bạn cũng đang làm cho tôi tự hỏi liệu tập hợp học tập văn học giữ một cái gì đó có liên quan.
Jack Tanner

Khi bạn nói "nhiều cross-validation", bạn có nghĩa là bạn chạy lần -fold cross-validation? mk
boscovich

@andrea, tôi nói "nhiều lần xác thực chéo", tức là lần. k
Jack Tanner

Câu trả lời:


2

Bạn có thể coi các hệ số hồi quy từ mỗi lần kiểm tra trong CV là các quan sát độc lập và sau đó tính toán độ tin cậy / độ ổn định của chúng bằng hệ số tương quan giữa lớp (ICC) như báo cáo của Shrout & Fleiss.


0

Tôi giả sử bạn trong quá trình xác nhận chéo của bạn, bạn chia dữ liệu thành hai phần, tập huấn luyện và tập kiểm tra. Trong một lần, bạn lắp một mô hình từ tập huấn luyện và sử dụng nó để dự đoán đáp ứng của tập kiểm tra, phải không? Điều này sẽ cung cấp cho bạn một tỷ lệ lỗi cho toàn bộ mô hình, không phải cho một người dự đoán.

Tôi không biết liệu có thể tìm thấy giá trị p cho các yếu tố dự đoán hay không bằng cách sử dụng các phép thử F được sử dụng trong hồi quy tuyến tính thông thường.

Bạn có thể thử loại bỏ các yếu tố dự đoán khỏi mô hình bằng cách sử dụng lựa chọn lùi hoặc tiến nếu ví dụ đó là mục tiêu của bạn.

Bạn có thể thay vì CV sử dụng bootstrap để tìm khoảng tin cậy cho từng dự đoán và sau đó xem mức độ ổn định của nó.

Bạn sử dụng bao nhiêu lần trong CV của mình, đó có phải là xác thực chéo một lần không?

Có lẽ nhiều chi tiết hơn về mục tiêu của bạn là gì sẽ giúp trả lời câu hỏi này.


Giả sử đây là một trong một. Mỗi công cụ dự đoán trong mỗi lần gấp đã có khoảng tin cậy, ví dụ: từ CI sau của Bayes hoặc lỗi std từ glm(..., family="binomial")R. Tôi phải làm gì với các khoảng cho mỗi công cụ dự đoán trong các lần chạy rời?
Jack Tanner
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.