Phân phối tổng bình phương sai số cho hồi quy tuyến tính?


12

Tôi biết rằng phân phối phương sai mẫu Đó là từ thực tế rằng có thể được biểu thị dưới dạng ma trận, (trong đó A: đối xứng) và nó có thể được biểu thị lại bằng: (trong đó Q: trực giao, ma trận đường chéo).

(XiX¯)2σ2χ(n1)2
(XiX¯)2n1σ2n1χ(n1)2
(XX¯)2xAxxQDQx

Thế còn , đưa ra giả định ? ( Y - β 0 - β 1 X ) ~ N ( 0 , σ 2 )(Yiβ^0β^1Xi)2(Yβ0β1X)N(0,σ2)

Tôi hình

(Yiβ^0β^1Xi)2σ2χ(n2)2.

Nhưng tôi không biết làm thế nào để chứng minh nó hoặc hiển thị nó.

Nó có được phân phối chính xác như không?χ(n2)2


1
Đây có phải là bài tập về nhà không? Nếu vậy, xin vui lòng sử dụng thẻ Bài tập về nhà.
MånsT

Không, không phải vậy. Tôi nghĩ rằng đó là bcoz thật, xét cho cùng, tổng bình phương là một hình vuông kết hợp tuyến tính của hằng số X của Y. Nhưng nó là? Bằng chứng đơn giản như thế này sẽ được đánh giá cao! math.stackexchange.com/questions/47009/ Mạnh
KH Kim

Các mô tả bạn đưa ra trong cả câu hỏi và nhận xét của bạn có một chút sai lầm. Bạn đã viết ra ma trận của bạn phải là gì đối với phương sai mẫu chưa? Điều đó có giúp bạn thấy làm thế nào để khái quát? A
Đức Hồng Y

Đã sửa cho D. Tôi nghĩ điểm quan trọng là phần tử đường chéo của D phải giống như (1,1,1, ..., 1,0,0). Có cách nào để chứng minh điều đó? hoặc Có cách nào để hiển thị rằng trong đó sse / ,σ 2 ~ χ 2 ( n - 2 ) Σ e 2 i / σ 2 ~ χ 2 ( n )χ2(n)=χ2(n2)+χ2(1)+χ2(1)σ2χ2(n2)ei2/σ2χ2(n)
KH Kim

Câu trả lời:


13

Chúng ta có thể chứng minh điều này cho trường hợp tổng quát hơn của các biến bằng cách sử dụng "ma trận mũ" và một số thuộc tính hữu ích của nó. Những kết quả này thường khó khăn hơn nhiều để nêu trong các thuật ngữ phi ma trận do sử dụng phân rã phổ.p

Bây giờ trong phiên bản ma trận có bình phương tối thiểu, ma trận mũ là trong đó có hàng và cột (cột của cột cho ). Giả sử thứ hạng cột đầy đủ cho thuận tiện - khác bạn có thể thay thế bằng thứ hạng cột của sau đây. Chúng ta có thể viết các giá trị được trang bị là hoặc trong ký hiệu ma trận . Sử dụng điều này, chúng ta có thể viết tổng bình phương là: X n p + 1 β 0 p + 1 X Y i = Σ n j = 1 H i j Y j Y = H YH=X(XTX)1XTXnp+1β0p+1XY^i=j=1nHijYjY^=HY

=YT(In-H)Y

i=1(YYi^)2σ2=(YY^)T(YY^)σ2=(YHY)T(YHY)σ2
=YT(InH)Yσ2

Trong đó là ma trận danh tính của đơn hàng . Bước cuối cùng xuất phát từ thực tế rằng là một ma trận bình dị, vì n H H 2 = [ X ( X T X ) - 1 X T ] [ X ( X T X ) - 1 X T ] = X ( X T X ) - 1 X T = H = H H T = H T HInnH

H2=[X(XTX)1XT][X(XTX)1XT]=X(XTX)1XT=H=HHT=HTH

Bây giờ một tính chất gọn gàng của ma trận bình dị là tất cả các giá trị riêng của chúng phải bằng 0 hoặc 1. Để biểu thị một hàm riêng được chuẩn hóa của với eigenvalue , chúng ta có thể chứng minh điều này như sau:H leHl

He=leH(He)=H(le)
LHS=H2e=He=leRHS=lHe=l2e
le=l2el=0 or 1

(lưu ý rằng không thể bằng 0 vì nó phải thỏa mãn ) Bây giờ vì là idepotent, cũng vậy, bởi vìeeTe=1HInH

(InH)(InH)=IIHHI+H2=InH

Chúng ta cũng có tính chất là tổng của các giá trị riêng bằng dấu vết của ma trận và

tr(InH)=tr(In)tr(H)=ntr(X(XTX)1XT)=ntr((XTX)1XTX)
=ntr(Ip+1)=np1

Do đó phải có giá trị riêng bằng và giá trị riêng bằng .IHnp11p+10

Bây giờ chúng ta có thể sử dụng phân rã phổ của trong đó và là trực giao (vì là đối xứng). Một tài sản hơn nữa đó là hữu ích là . Điều này giúp thu hẹp ma trậnIH=ADATD=(Inp10[np1]×[p+1]0[p+1]×[np1]0[p+1]×[p+1])AIHHX=XA

HX=X(IH)X=0ADATX=0DATX=0
(ATX)ij=0i=1,,np1j=1,,p+1

và chúng tôi nhận được:

i=1(YYi^)2σ2=YTADATYσ2=i=1np1(ATY)i2σ2

Bây giờ, trong mô hình chúng ta có và sử dụng lý thuyết chuẩn thông thường, chúng ta có cho thấy các thành phần của là độc lập. Bây giờ bằng cách sử dụng kết quả hữu ích, chúng ta có cho . Phân phối chi bình phương với bậc tự do cho tổng các lỗi bình phương ngay sau đó.YN(Xβ,σ2I)ATYN(ATXβ,σ2ATA)N(ATXβ,σ2I)ATY(ATY)iN(0,σ2)i=1,,np1np1


Wow, cảm ơn bạn rất nhiều. Nó thực sự là tuyệt vời! Hình thức ma trận thực sự được đền đáp! Tóm lại, SSE / và là idempotent. Ma trận tạm thời có giá trị riêng là 0 hoặc 1. Vậy tổng giá trị riêng là số của giá trị riêng 1. và kể từ và trở thành n-p +1. và tổng giá trị riêng của một ma trận là tổng các dấu vết của ma trận! và có thể được diễn tả như . Vì vậy, đầu tiên trở thành với D chỉ với np-1 đường chéo 1's. I n ) - t r ( ( X T X ) - 1 X T X ) t r ( A B ) = tσ2=YT(IH)YIHtr(InH)=tr(In)tr(H)=tr(In)tr(X(XTX)1XT)=tr(In)tr((XTX)1XTX)tr(AB)=tr(BA)tr(InH)IHADATYT(IH)YYTADATY
KH Kim

1
Câu trả lời chính xác!! Chỉ cần trình bày một cách tiếp cận khác, thay vào đó, chúng ta có thể chọn định nghĩa một biến thông thường đa biến đổi và nó vẫn sẽ theo cùng một phân phối nếu chúng ta sử dụng tài sản affine. Sau đó, phân số cuối cùng . N ( 0 , σ 2 I ) Y A D A Yv:=AYN(0,σ2I)YADAYσ2=vDvσ2=v[I000]vσ2=i=1trD(viσ)2
Daeyoung Lim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.