Làm thế nào để rút ra ma trận phương sai hiệp phương sai của các hệ số trong hồi quy tuyến tính


36

Tôi đang đọc một cuốn sách về hồi quy tuyến tính và gặp một số khó khăn khi hiểu ma trận phương sai hiệp phương sai của :b

nhập mô tả hình ảnh ở đây

Các mục chéo là đủ dễ, nhưng các mục chéo thì khó hơn một chút, điều khiến tôi là

σ(b0,b1)= =E(b0b1)-E(b0)E(b1)= =E(b0b1)-β0β1

nhưng không có dấu vết của và tại đây.β0β1



2
Đó là cuốn sách nào?
Konstantinos

Neter và cộng sự, Mô hình hồi quy tuyến tính ứng dụng, 1983, trang 216. Bạn có thể tìm thấy cùng một tài liệu trong Mô hình thống kê tuyến tính ứng dụng, Phiên bản 5, trang 207.
akavalar

Câu trả lời:


53

Đây thực sự là một câu hỏi thú vị thách thức sự hiểu biết cơ bản của bạn về hồi quy.

Đầu tiên đưa ra bất kỳ nhầm lẫn ban đầu về ký hiệu. Chúng tôi đang xem xét hồi quy:

y= =b0+b1x+bạn^

trong đó và là công cụ ước tính của và và là phần dư của hồi quy. Lưu ý rằng hồi quy đúng và không được giám sát cơ bản được ký hiệu là:b0b1β0β1ubạn^

y= =β0+β1x+bạn

Với kỳ vọng và phương sai . Một số sách biểu thị là và chúng tôi điều chỉnh quy ước này tại đây. Chúng tôi cũng sử dụng ký hiệu ma trận, trong đó b là vectơ 2x1 chứa các công cụ ước tính của , cụ thể là . (Ngoài ra, để rõ ràng, tôi coi X là cố định trong các tính toán sau.)E[bạn]= =0E[bạn2]= =σ2bββ^β= =[β0,β1]'b= =[b0,b1]'

Bây giờ đến câu hỏi của bạn. Công thức của bạn cho hiệp phương sai thực sự chính xác, đó là:

σ(b0,b1)= =E(b0b1)-E(b0)E(b1)= =E(b0b1)-β0β1

Tôi nghĩ rằng bạn muốn biết làm thế nào chúng ta có các hệ số không quan sát thực sự trong công thức này? Họ thực sự bị hủy bỏ nếu chúng ta tiến thêm một bước bằng cách mở rộng công thức. Để thấy điều này, lưu ý rằng phương sai dân số của công cụ ước tính được đưa ra bởi:β0,β1

Vmộtr(β^)= =σ2(X'X)-1

Ma trận này giữ các phương sai trong các phần tử đường chéo và hiệp phương sai trong các phần tử đường chéo.

Để đi đến công thức trên, hãy khái quát hóa yêu cầu của bạn bằng cách sử dụng ký hiệu ma trận. Do đó, chúng ta hãy biểu thị phương sai với và kỳ vọng với .Vmộtr[]E[]

Vmộtr[b]= =E[b2]-E[b]E[b']

Về cơ bản chúng ta có công thức phương sai chung, chỉ cần sử dụng ký hiệu ma trận. Phương trình giải quyết khi thay thế trong biểu thức chuẩn cho công cụ ước tính . Đồng thời giả sử là một công cụ ước tính không thiên vị. Do đó, chúng tôi có được:b= =(X'X)-1X'yE[b]= =β

E[((X'X)1Xy)2]β22×2

Lưu ý rằng chúng tôi có ma trận bên phải - 2x2, cụ thể là , nhưng tại thời điểm này bạn có thể đoán được điều gì sẽ xảy ra với thuật ngữ này trong thời gian ngắn.β2bb

Thay thế bằng biểu thức của chúng tôi cho quy trình tạo dữ liệu cơ bản thực sự ở trên, chúng tôi có:y

E[((XX)1Xy)2]β2=E[((XX)1X'(Xβ+bạn))2]-β2= =E[((X'X)-1X'X= =tôiβ+(X'X)-1X'bạn)2]-β2= =E[(β+(X'X)-1X'bạn)2]-β2= =β2+E[(X'X)-1X'bạn)2]-β2

kể từ khi . Hơn nữa, thuật ngữ bậc hai hủy bỏ như dự đoán.E[bạn]= =0β2

Vì vậy, chúng tôi có:

Vmộtr[b]= =((X'X)-1X')2E[bạn2]

Theo tuyến tính của kỳ vọng. Lưu ý rằng theo giả định và vì là ma trận đối xứng và do đó giống như chuyển vị của nó. Cuối cùng chúng tôi cũng đếnE[bạn2]= =σ2((X'X)-1X')2= =(X'X)-1X'X(X'X)'-1= =(X'X)-1X'XK×K

Vmộtr[b]= =σ2(X'X)-1

Bây giờ chúng tôi đã thoát khỏi tất cả các điều khoản . Theo trực giác, phương sai của công cụ ước tính không phụ thuộc vào giá trị của hệ số cơ bản thực sự, vì đây không phải là một biến ngẫu nhiên trên mỗi se. Kết quả là hợp lệ cho tất cả các yếu tố riêng lẻ trong ma trận hiệp phương sai như trong sách, do đó cũng hợp lệ đối với các yếu tố đường chéo cũng như với để hủy bỏ tương ứng. Vấn đề duy nhất là ban đầu bạn đã áp dụng công thức chung cho phương sai không phản ánh sự hủy bỏ này.ββ0β1

Cuối cùng, phương sai của các hệ số giảm xuống còn và độc lập với . Nhưng nó có nghĩa gì? (Tôi tin rằng bạn cũng yêu cầu hiểu biết chung hơn về ma trận hiệp phương sai chung)σ2(X'X)-1β

Nhìn vào công thức trong cuốn sách. Nó chỉ đơn giản xác nhận rằng phương sai của công cụ ước tính tăng khi thời hạn lỗi cơ bản thực sự ồn hơn ( tăng), nhưng giảm khi độ lây lan của X tăng. Vì có nhiều quan sát trải rộng xung quanh giá trị thực, cho phép bạn nói chung xây dựng một công cụ ước tính chính xác hơn và do đó gần với . Mặt khác, các thuật ngữ hiệp phương sai trên đường chéo thực tế có liên quan thực tế trong kiểm tra giả thuyết về các giả thuyết chung như . Khác hơn là họ có một chút sai lầm, thực sự. Hy vọng điều này làm rõ tất cả các câu hỏi.σ2 β b 0 = b 1 = 0βb0= =b1= =0


và khi giữ mức chênh lệch không đổi và giảm x, lỗi tiêu chuẩn của phần chặn trở nên nhỏ hơn, điều này có ý nghĩa.
Theta30

Tôi không theo dõi việc mở rộng quảng trường. Tại sao không được đơn giản hóa thành ? ((X'X)-1X')2= =((X'X)-1X')((X'X)-1X')= =X-2
David

2

Trong trường hợp của bạn, chúng tôi có

X'X= =[nΣXtôiΣXtôiΣXtôi2]

Đảo ngược ma trận này và bạn sẽ nhận được kết quả mong muốn.


1

Dường như là các giá trị được dự đoán (giá trị dự kiến). Họ thực hiện chuyển đổi giữa và .β0β1E(b0)= =β0E(b1)= =β1


β0 và thường không xác định, họ có thể chuyển sang cái gì? β1
qed

Tôi nghĩ rằng tôi hiểu sự nhầm lẫn và tôi nghĩ có lẽ họ nên viết thay vì . Đây là một bài viết khác thông qua tính toán: linkβ0*β0
Drew75

2
@qed: để ước tính mẫu của số lượng chưa biết.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.