Tôi đã tìm thấy các định nghĩa có thể mâu thuẫn đối với thống kê xác thực chéo (CV) và thống kê xác thực chéo (GCV) được liên kết với mô hình tuyến tính (với một vectơ lỗi đồng nhất, bình thường ).ε
Một mặt, Golub, Heath & Wahba định nghĩa ước tính GCV là (trang 216)
bộ thu nhỏ của do V \ left (\ lambda \ right) = \ frac {\ frac {1} {n} \ left \ | \ left (I - A \ left (\ lambda \ phải) \ phải) y \ phải \ | ^ 2} {\ left (\ frac {1} {n} \ mathrm {tr} \ left (I - A \ left (\ lambda \ right) \ right) \ right ) ^ 2} trong đó A \ left (\ lambda \ right) = X \ left (X ^ TX + n \ lambda I \ right) ^ {- 1} X ^ T V ( λ ) = 1Một(λ)=X(XTX+nλtôi)-1XT
Mặt khác, Efron định nghĩa khái niệm tương tự như (trang 24), tuy nhiên, ông cho rằng việc giới thiệu khái niệm này với Craven & Wahba, trong đó định nghĩa của nó (trang 377) về cơ bản là giống nhau như định nghĩa đã đề cập ở trên của Golub, Heath & Wahba.
Điều này có nghĩa là giảm thiểu ?
Tương tự, Golub, Heath & Wahba định nghĩa ước tính CV của (tr. 217) là tối thiểu hóa
trong đó là ước tính
của với điểm dữ liệu thứ k y_i bị bỏ qua.
Các tác giả gán phần giới thiệu ước tính CV (còn gọi là ước tính PRESS) cho Allen ("PRESS của Allen", ibid.) Tuy nhiên, trong bài viết của Allen, ước tính PRESS được định nghĩa (tr. 126) là (trong bài viết của Efron, nó được định nghĩa là (trang 24)).
Một lần nữa, điều này có nghĩa là giảm thiểu ?
Allen, David M. Mối quan hệ giữa lựa chọn biến và phân tích dữ liệu và phương pháp dự đoán. Kỹ thuật, Tập. 16, số 1 (tháng 2 năm 1974), trang 125-127
Craven, Peter và Wahba, Grace. Làm mịn dữ liệu ồn ào với chức năng Spline. Numerische Mathematik 31, (1979), trang 377-403
Efron, Bradley. Làm thế nào thiên vị là tỷ lệ lỗi rõ ràng của một hồi quy logistic? Báo cáo kỹ thuật số 232. Khoa Thống kê, Đại học Stanford (Tháng 4 năm 1985)
Golub, Gene H., Heath và Grace Wahba. Xác thực chéo tổng quát như một phương pháp để chọn tham số độ dốc tốt. Kỹ thuật, Tập. 21, số 2 (tháng 5 năm 1979), trang 215-223