Jackknife so với LOOCV


15

Có thực sự có sự khác biệt giữa jackknife và bỏ qua một xác nhận chéo? Các thủ tục có vẻ giống hệt như tôi đang thiếu một cái gì đó?

Câu trả lời:


11

Khi xác thực chéo, bạn tính toán một thống kê trên (các) mẫu bên trái. Thông thường, bạn dự đoán (các) mẫu bên trái bằng một mô hình được xây dựng trên các mẫu được giữ. Trong jackknifing, bạn chỉ tính toán một thống kê từ các mẫu được giữ.


4
Tôi không hiểu câu trả lời này nói với LOOCV như thế nào trong câu hỏi ban đầu. Theo nghĩa nào người ta có thể "tính toán một thống kê" trên một quan sát bên trái duy nhất ?
Alexis

12

Jackknife thường đề cập đến 2 quá trình liên quan nhưng khác nhau, cả hai đều dựa trên cách tiếp cận bỏ qua - dẫn đến sự nhầm lẫn này.

Trong một bối cảnh, jackknife có thể được sử dụng để ước tính các tham số dân số và các lỗi tiêu chuẩn của chúng. Ví dụ, để sử dụng phương pháp jackknife để ước tính độ dốc và đánh chặn của mô hình hồi quy đơn giản, người ta sẽ:

  1. Ước tính độ dốc và đánh chặn bằng cách sử dụng tất cả các dữ liệu có sẵn.
  2. Để lại 1 quan sát và ước tính độ dốc và đánh chặn (còn được gọi là "ước tính một phần" của các hệ số).
  3. Tính toán sự khác biệt giữa "ước tính một phần" và ước tính "tất cả dữ liệu" của độ dốc và giao thoa (còn được gọi là "giá trị giả" của các hệ số).
  4. Lặp lại các bước 2 & 3 cho toàn bộ tập dữ liệu.
  5. Tính giá trị trung bình của các giá trị giả cho từng hệ số - đây là các ước tính của jackknife về độ dốc và giao thoa

Các giá trị giả và ước tính jackknife của các hệ số cũng có thể được sử dụng để xác định các lỗi tiêu chuẩn và do đó khoảng tin cậy. Thông thường, cách tiếp cận này mang lại khoảng tin cậy rộng hơn cho các hệ số bởi vì đó là thước đo độ không chắc chắn tốt hơn, bảo thủ hơn. Ngoài ra, cách tiếp cận này có thể được sử dụng để có được ước tính sai lệch cho các hệ số.

Trong bối cảnh khác, jackknife được sử dụng để đánh giá hiệu suất mô hình. Trong trường hợp này jackknife = xác thực chéo một lần. Cả hai đều đề cập đến việc bỏ một quan sát ra khỏi bộ dữ liệu hiệu chuẩn, hiệu chỉnh lại mô hình và dự đoán quan sát bị bỏ sót. Về cơ bản, mỗi quan sát đang được dự đoán bằng cách sử dụng "ước tính một phần" của các yếu tố dự đoán.

Đây là một bài viết nhỏ về jackknife tôi tìm thấy trên mạng: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf


1
Trừ khi tôi nhầm (và tôi cũng có thể như vậy), bối cảnh đầu tiên của bạn mô tả xác thực chéo một lần một .
Alexis

2
Tôi chỉ phân tách các ý tưởng ước tính các tham số bằng LOO so với ước tính giá trị còn sót lại (như trong LOOCV). Tôi thấy chúng là hai quá trình liên quan nhưng hơi khác nhau, nhưng có lẽ cả hai có thể được gọi là LOOCV? Tôi cũng có thể bị nhầm lẫn.
jcmb
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.