Bằng chứng về công thức LOOCV


18

Từ Giới thiệu về Học thống kê của James và cộng sự, ước tính xác thực chéo một lần (LOOCV) được xác định bởi

CV(n)=1ni=1nMSEi
nơiMSEi=(yiy^i)2.

Không có bằng chứng, phương trình (5.2) nói rằng đối với hồi quy bình phương nhỏ nhất hoặc đa thức (cho dù điều này áp dụng cho hồi quy trên chỉ một biến là không xác định đối với tôi),

CV(n)=1ni=1n(yiy^i1hi)2
nơi "yiithứ giá trị được trang bị từ bản gốc nhất hình vuông phù hợp (không có ý tưởng gì này có nghĩa là, bằng cách này, có nghĩa là từ việc sử dụngtất cả? Trong những điểm trong tập dữ liệu) vàhilà đòn bẩy "được xác định bởihi=1y^iihi
hi=1n+(xix¯)2j=1n(xjx¯)2.

Làm thế nào để chứng minh điều này?

Nỗ lực của tôi: người ta có thể bắt đầu bằng cách nhận thấy rằng y i = β 0 + k Σ i = 1 β k X k + một số thuật ngữ đa thức bậc  2 nhưng ngoài việc này (và nếu tôi nhớ lại, đó là công thức cho h i duy nhất là đúng với hồi quy tuyến tính đơn giản ...), tôi không chắc cách tiến hành từ đây.

y^i=β0+i=1kβkXk+some polynomial terms of degree 2
hi

Phương trình của bạn dường như sử dụng cho nhiều thứ hoặc tôi rất bối rối. Cả hai cách rõ ràng hơn sẽ tốt. i
Glen_b -Reinstate Monica

@Glen_b Tôi mới tìm hiểu về LOOCV ngày hôm qua, vì vậy tôi có thể không hiểu một số điều chính xác. Từ những gì tôi hiểu, bạn có một tập hợp các điểm dữ liệu, nói . Với LOOCV, bạn có cho mỗi (số nguyên dương) cố định k một số bộ xác thực V k = { ( x k , y k ) } và một bộ kiểm tra T k = XV k được sử dụng để tạo mô hình phù hợp cho từng mô hìnhX={(xi,yi):iZ+}kVk={(xk,yk)}Tk=XVk . Ví dụ, giả sử chúng ta phù hợp với mô hình của mình bằng cách sử dụng hồi quy tuyến tính đơn giản với ba điểm dữ liệu, X = { ( 0 , 1 ) , ( 1 , 2 ) , ( 2 , 3 ) } . Chúng tôi sẽ có (sẽ được tiếp tục)kX={(0,1),(1,2),(2,3)}
Clarinetist

@Glen_b T 1 = { ( 1 , 2 ) , ( 2 , 3 ) } . Sử dụng các điểm trong T 1 , chúng ta có thể thấy rằng việc sử dụng hồi quy tuyến tính đơn giản, chúng tôi nhận được mô hình y i = X + 1 . Sau đó, chúng tôi tính toán MSE bằng cách sử dụng V 1 làm bộ xác nhận và nhận y 1 = 1V1={(0,1)}T1={(1,2),(2,3)}T1y^i=X+1MSEV1y1=1(chỉ sử dụng các điểm nhất định) và y , cho MSE 1 = 0 . Được rồi, có lẽ sử dụng siêu ký tự không phải là ý tưởng tốt nhất - tôi sẽ thay đổi điều này trong bài viết gốc. y^1(1)=0+1=1MSE1=0
Clarinetist

Câu trả lời:


17

Tôi sẽ hiển thị kết quả cho bất kỳ hồi quy tuyến tính nào, cho dù các biến hồi quy có phải là đa thức của hay không. Trên thực tế, nó cho thấy nhiều hơn một chút so với những gì bạn đã hỏi, bởi vì nó cho thấy rằng mỗi phần dư LOOCV giống hệt với phần dư có trọng số đòn bẩy tương ứng từ hồi quy đầy đủ, không chỉ là bạn có thể nhận được lỗi LOOCV như trong (5.2) (có) có thể là những cách khác mà trung bình đồng ý, ngay cả khi không phải mỗi thuật ngữ trong trung bình là như nhau).Xt

Hãy để tôi lấy tự do để sử dụng ký hiệu hơi thích nghi.

Đầu tiên chúng ta thấy rằng β nơi β là ước tính sử dụng tất cả các dữ liệu và β (t)ước tính khi rời khỏi ra

β^β^(t)=(u^t1ht)(XX)1Xt,(A)
β^β^(t)X(t)tXty^t=Xtβ^u^t

Chứng minh sử dụng kết quả đại số ma trận sau.

Abλ

λ1bA1b
(A+λbb)1=A1(λ1+λbA1b)A1bbA1(B) 

{A1(λ1+λbA1b)A1bbA1}(A+λbb)=I.

Kết quả sau đây là hữu ích để chứng minh (A)

(X(t)X(t))1Xt=(11ht)(XX)1Xt. (C)

Bằng chứng về (C): Bằng (B), chúng tôi có, sử dụng t=1TXtXt=XX

(X(t)X(t))1=(XXXtXt)1=(XX)1+(XX)1XtXt(XX)11Xt(XX)1Xt.
(X(t)X(t))1Xt=(XX)1Xt+(XX)1Xt(Xt(XX)1Xt1Xt(XX)1Xt)=(11ht)(XX)1Xt.

XXβ^=Xy,
(X(t)X(t)+XtXt)β^=X(t)y(t)+Xtyt,
{Ik+(X(t)X(t))1XtXt}β^=β^(t)+(X(t)X(t))1Xt(Xtβ^+u^t).
So,
β^=β^(t)+(X(t)X(t))1Xtu^t=β^(t)+(XX)1Xtu^t1ht,
where the last equality follows from (C).

Now, note ht=Xt(XX)1Xt. Multiply through in (A) by Xt, add yt on both sides and rearrange to get, with u^(t) the residuals resulting from using β^(t) (ytXtβ^(t)),

u^(t)=u^t+(u^t1ht)ht
or
u^(t)=u^t(1ht)+u^tht1ht=u^t1ht

The definition for X(t) is missing in your answer. I assume this is a matrix X with row Xt removed.
mpiktas

Also mentioning the fact that XX=t=1TXtXt would be helpful too.
mpiktas

@mpiktas, yes, thanks for the pointers. I edited to take the first comment into account. Where exactly would the second help? Or just leave it in your comment?
Christoph Hanck

3
When you start the proof of (C) you write (X(t)X(t))1=(XXXtXt)1. That is a nice trick, but I doubt that casual reader is aware of it.
mpiktas

1
Two years later... I appreciate this answer even more, now that I've gone through a graduate-level linear models sequence. I'm re-learning this material with this new perspective. Do you have any suggested references (textbooks?) which go through derivations like what you have in this answer in detail?
Clarinetist
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.