Phương pháp lấy mẫu lại caret


20

Tôi đang sử dụng thư viện carettrong R để kiểm tra các quy trình mô hình hóa khác nhau.

Đối trainControltượng cho phép một người chỉ định một phương pháp lấy mẫu lại. Các phương pháp được mô tả trong tài liệu hướng dẫn mục 2.3 và bao gồm: boot, boot632, cv, LOOCV, LGOCV, repeatedcvoob. Mặc dù một số trong số này dễ suy luận, nhưng không phải tất cả các phương pháp này đều được xác định rõ ràng.

Các thủ tục tương ứng với các phương pháp lấy mẫu lại là gì?


liên kết tài liệu bị hỏng. Sử dụng cái này thay thế.
vikas

Câu trả lời:


20

Ok, đây là thử của tôi:

  • khởi động - bootstrap
  • boot632 - 0,632 bootstrap
  • cv - xác thực chéo, có lẽ điều này đề cập đến xác thực chéo K-Fold .
  • LOOCV - xác nhận chéo bỏ qua một lần, còn được gọi là jacknife.
  • LGOCV - xác thực chéo nhóm rời khỏi, biến thể của LOOCV cho dữ liệu phân cấp.
  • repeatcv - có thể được lặp lại xác nhận lấy mẫu phụ ngẫu nhiên , nghĩa là việc phân chia để đào tạo và kiểm tra dữ liệu được thực hiện theo cách ngẫu nhiên.
  • oob - đề cập đến ước tính tiền túi được đề xuất bởi Breiman , liên quan đến tổng hợp bootstrap . (Tệp trong liên kết không phải là tệp ps, mà là tệp ps.Z, đổi tên tệp và sau đó thử mở.)

1
Tôi tin rằng LGOCV là sự phân chia ngẫu nhiên giữa tập huấn luyện và tập xác thực, lặp lại n lần. Vì vậy, thay vì trường hợp phân chia dữ liệu thông thường giữa tàu và giữ (mô hình xây dựng trên tàu và xác nhận tạm dừng) một lần, quy trình này được lặp lại nhiều lần.
B_Miner

3
Tôi cũng tin rằng repeatCV là xác nhận chéo k lần, được thực hiện nhiều lần.
B_Miner

Khó tin điều này không được ghi nhận ở đâu đó.
andrew

4

Theo repeatedcvxác nhận của Max Kuhn, việc lặp lại xác thực chéo chéo gấp 10 lần. Lược đồ lấy mẫu mặc định là bootstrap.

Một tệp tốt mà bạn có thể xem về các phương pháp lấy mẫu lại là Mô hình dự đoán với R và Gói caret ( pdf ). Max đã trình bày điều này trong "useR! 2013".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.