Tại sao loại bỏ lạc hậu là hợp lý khi thực hiện hồi quy bội?


9

Nó không dẫn đến phù hợp quá mức? Kết quả của tôi sẽ đáng tin cậy hơn nếu tôi thêm quy trình jack-dao hoặc bootstrap như một phần của phân tích?


8
Ai nói nó hợp lý? Tất nhiên nó sẽ dẫn đến thừa.
gung - Phục hồi Monica

2
Nó thực sự được đề xuất trong nhiều cuốn sách (vẫn vậy?), Ví dụ như amazon.com/Statistic-Explained-Int sinhtory-Guide-Sellectists / Lỗi . Tôi đã suy nghĩ vấn đề tương tự bản thân mình. Tôi nghĩ rằng tôi có ít nhất 3-4 cuốn sách thống kê hoàn toàn không thảo luận về vấn đề quá mức, khi đưa ra hồi quy bội.
mmh

5
Thành thật mà nói, nếu một cuốn sách thống kê giới thiệu không thảo luận về việc đánh giá quá mức và kiểm tra quá mức, tôi sẽ đọc một cuốn sách khác.
Matthew Drury

3
Loại bỏ lùi (và lựa chọn chuyển tiếp) vẫn có xu hướng phù hợp quá mức nếu xác thực chéo một lần (ví dụ PRESS) được sử dụng làm tiêu chí lựa chọn tính năng.
Dikran Marsupial

5
@mmh không hoàn toàn giới thiệu, nhưng tôi khuyên bạn nên đọc chương 4 của Chiến lược mô hình hồi quy của Frank Harrell ( vâng , nó không chỉ là chương 4 đáng đọc, mà là phần đặc biệt liên quan đến cuộc thảo luận này).
Glen_b -Reinstate Monica

Câu trả lời:


2

Tôi nghĩ rằng việc xây dựng một mô hình và thử nghiệm nó là những điều khác nhau. Việc loại bỏ lạc hậu là một phần của việc xây dựng mô hình. Jack dao và bootstrap được sử dụng nhiều hơn để kiểm tra nó.

Bạn chắc chắn có thể có các ước tính đáng tin cậy hơn với bootstrap và jack dao hơn là cách di chuyển ngược đơn giản. Nhưng nếu bạn thực sự muốn kiểm tra quá mức, thử nghiệm cuối cùng là một mẫu phân tách, đào tạo trên một số, thử nghiệm trên những người khác. Rời khỏi một lần là quá không ổn định / không đáng tin cậy cho mục đích này: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html

Tôi nghĩ rằng ít nhất 10% đối tượng cần phải ra ngoài để có được ước tính ổn định hơn về độ mạnh của mô hình. Và nếu bạn có 20 môn, 2 môn vẫn còn rất ít. Nhưng sau đó, câu hỏi đặt ra là liệu bạn có một mẫu đủ lớn để xây dựng một mô hình có thể áp dụng cho phần còn lại của dân số hay không.

Hy vọng nó trả lời câu hỏi của bạn ít nhất một phần.


k<nk<<n

Giới thiệu về Học thống kê thảo luận về các cách tiếp cận khác nhau để lấy mẫu lại (bộ xác thực, xác thực chéo với số lượng nhóm khác nhau, bootstrapping) trong Chương 5 và lựa chọn mô hình trong Chương 6.
EdM
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.