Giải pháp phân tích để ước tính hệ số hồi quy tuyến tính


9

Tôi đang cố gắng để hiểu ký hiệu ma trận, và làm việc với các vectơ và ma trận.

Ngay bây giờ tôi muốn hiểu cách tính vectơ ước tính hệ số trong hồi quy bội được tính toán.β^

Phương trình cơ bản dường như là

ddβ(yXβ)(yXβ)=0.

Bây giờ tôi sẽ giải quyết một vectơ β ở đây như thế nào?

Chỉnh sửa : Đợi đã, tôi bị kẹt. Bây giờ tôi đang ở đây và không biết làm thế nào để tiếp tục:

ddβ((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))((y1y2yn)(1x11x12x1p1x21x22x2p1xn1xn2xnp)(β0β1βp))

ddβi=1n(yi(1xi1xi2xip)(β0β1βp))2

Với cho tất cả là phần chặn:xi0=1i

ddβi=1n(yik=0pxikβk)2

Bạn có thể chỉ cho mình hướng chính xác được không?


@GaBorgulya, cảm ơn vì đã chỉnh sửa, không biết về nó smallmatrix, vì vậy đã không cố gắng chỉnh sửa, vì giải pháp thông thường là phá vỡ công thức trong một số dòng sẽ không hoạt động ở đây.
mpiktas

Câu trả lời:


12

Chúng ta có

ddβ(yXβ)(yXβ)=2X(yXβ) .

Nó có thể được hiển thị bằng cách viết phương trình rõ ràng với các thành phần. Ví dụ: viết thay vì . Sau đó lấy các dẫn xuất liên quan đến , , ..., và xếp mọi thứ để có câu trả lời. Để minh họa nhanh chóng và dễ dàng, bạn có thể bắt đầu với . β β 1 β 2 β p p = 2(β1,,βp)ββ1β2βpp=2

Với kinh nghiệm người ta phát triển các quy tắc chung, một số trong đó được đưa ra, ví dụ, trong tài liệu đó .

Chỉnh sửa để hướng dẫn cho phần bổ sung của câu hỏi

Với , chúng ta cóp=2

(yXβ)(yXβ)=(y1x11β1x12β2)2+(y2x21β1x22β2)2

Đạo hàm liên quan đến làβ1

2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)

Tương tự, đạo hàm tương ứng với làβ2

2x12(y1x11β1x12β2)2x22(y2x21β1x22β2)

Do đó, đạo hàm liên quan đến làβ=(β1,β2)

(2x11(y1x11β1x12β2)2x21(y2x21β1x22β2)2x12(y1x11β1x12β2)2x22(y2x21β1x22β2))

Bây giờ, quan sát bạn có thể viết lại biểu thức cuối cùng như

2(x11x21x12x22)(y1x11β1x12β2y2x21β1x22β2)=2X(yXβ)

Tất nhiên, tất cả mọi thứ được thực hiện theo cùng một cách cho một lớn hơn .p


Tuyệt vời, tôi đã tìm kiếm chính xác loại pdf. Cảm ơn rất nhiều!
Alexander Engelhardt

Ồ, tôi nghĩ rằng tôi có thể tự làm điều đó ngay bây giờ, nhưng tôi không thể. Bạn có thể cho tôi biết nếu các bước của tôi là đúng hoặc nếu tôi nên dùng "cách khác" để giải quyết vấn đề này?
Alexander Engelhardt

@Alexx Hardt: Phương trình đầu tiên của tôi trong chỉnh sửa giống như phương trình cuối cùng của bạn trong trường hợp cụ thể trong đó p = 2. Vì vậy, bạn có thể bắt chước các tính toán của tôi cho các thành phần 3, 4, ..., p.
ocram

Cảm ơn một lần nữa :) Tôi nghĩ rằng tôi thực sự sẽ sử dụng cả ba gợi ý. Tôi đang xây dựng một .pdf giải thích và tổng hợp đại số ma trận thống kê cơ bản, bởi vì tôi bằng cách nào đó không bao giờ muốn học nó khi tôi học nó trong các lớp học. Để giải quyết nó bằng ba cách khác nhau sẽ giúp tôi hiểu nó tốt hơn, tôi hy vọng.
Alexander Engelhardt

Ồ, nhưng đây là cho p = 2 và n = 2, phải không? Tôi sẽ viết nó xuống với n = 3 tôi nghĩ.
Alexander Engelhardt

13

Bạn cũng có thể sử dụng các công thức từ sách dạy nấu ăn Matrix . Chúng ta có

(yXβ)(yXβ)=yyβXyyXβ+βXXβ

Bây giờ lấy đạo hàm của mỗi thuật ngữ. Bạn có thể muốn nhận thấy rằng . Đạo hàm của thuật ngữ đối với là zero. Nhiệm kỳ còn lạiy ' y ββXy=yXβyyβ

βXXβ2yXβ

là hình thức của chức năng

f(x)=xAx+bx,

trong công thức (88) trong cuốn sách ở trang 11, với , và . Đạo hàm được đưa ra trong công thức (89):A = X Xx=βA=XXb=2Xy

fx=(A+A)x+b

vì thế

β(yXβ)(yXβ)=(XX+(XX))β2Xy

Bây giờ kể từ chúng tôi có được giải pháp mong muốn:(XX)=XX

XXβ=Xy

+1 mpiktas: Giải pháp của bạn khéo léo hơn tôi và tôi nghĩ nó nên được sử dụng trong các tình huống thực tế phức tạp hơn.
ocram

1
@ocram, cảm ơn. Tôi sẽ không gọi nó là khéo léo, nó là một ứng dụng tiêu chuẩn của các công thức hiện có. Bạn chỉ cần biết các công thức :)
mpiktas

8

Dưới đây là một kỹ thuật để giảm thiểu tổng bình phương trong hồi quy thực sự có các ứng dụng cho các cài đặt chung hơn và tôi thấy hữu ích.

Chúng ta hãy cố gắng tránh tính toán ma trận vector hoàn toàn.

Giả sử chúng tôi quan tâm đến việc giảm thiểu trong đó , và . Chúng tôi giả sử cho đơn giản rằng và .YR n XR n × p beta R p p n r một n k ( X ) = p

E=(yXβ)T(yXβ)=yXβ22,
yRnXRn×pβRppnrank(X)=p

Đối với mọi , chúng tôi nhận được E=y-X β +X β -Xβ 2 2 =y-X β 2 2 +X(β - β ) 2 2 -2(β- β )TXT(y- Xβ^Rp

E=yXβ^+Xβ^Xβ22=yXβ^22+X(ββ^)222(ββ^)TXT(yXβ^).

Nếu chúng ta có thể chọn (tìm!) Một vectơ sao cho thuật ngữ cuối cùng ở phía bên phải là 0 cho mọi , thì chúng ta sẽ hoàn thành, vì điều đó có nghĩa là . βphútβEy-X β 2 2β^ βminβEyXβ^22

Nhưng, cho tất cả khi và chỉ khi và phương trình cuối cùng này là đúng khi và chỉ khi . Vì vậy, được giảm thiểu bằng cách lấy .β X T ( y - X β ) = 0 X T X β = X T y E β = ( X T X ) - 1 X T y(ββ^)TXT(yXβ^)=0βXT(yXβ^)=0XTXβ^=XTyEβ^=(XTX)1XTy


Mặc dù điều này có vẻ giống như một "mẹo" để tránh tính toán, nhưng nó thực sự có ứng dụng rộng hơn và có một số hình học thú vị khi chơi.

Một ví dụ mà kỹ thuật này làm cho một derivation nhiều đơn giản hơn so với bất kỳ phương pháp tính toán ma trận vector là khi chúng ta khái quát cho trường hợp ma trận. Hãy để , và . Giả sử chúng tôi muốn giảm thiểu trên toàn bộ ma trận của các tham số . Ở đây là một ma trận hiệp phương sai. XR n × q BR q × p E = t r ( ( Y - X B ) Σ - 1 ( Y - X B ) T ) B ΣYRn×pXRn×qBRq×p

E=tr((YXB)Σ1(YXB)T)
BΣ

Một cách tiếp cận hoàn toàn tương tự như trên nhanh chóng xác định rằng mức tối thiểu của đạt được bằng cách lấy Đó là, trong một khung cảnh hồi quy nơi đáp ứng là một vector với hiệp phương sai và các quan sát độc lập, sau đó ước tính OLS là đạt được bằng cách làm hồi quy tuyến tính riêng về các thành phần của câu trả lời.B = ( X T X ) - 1 X T YEΣ p

B^=(XTX)1XTY.
Σp

May mắn là các quy tắc diễn đàn cho phép thêm +1 vào mỗi câu trả lời. Cảm ơn sự giáo dục, các bạn!
DWin

@DWin, ý của bạn là đăng bài này dưới phần bình luận cho câu hỏi?
Đức Hồng Y

Tôi cho rằng tôi có thể có. Tôi đã tuần tự đi qua câu hỏi và sau đó tất cả các câu trả lời (sau khi quá trình xử lý MathML ngừng bị giật) và tìm thấy từng câu trả lời có nhiều thông tin. Tôi chỉ bỏ bình luận của tôi về bạn vì đó là nơi tôi ngừng đọc.
DWin

1
@DWin, vâng, kết xuất là một chút sôi nổi. Tôi nghĩ rằng bạn có thể đã có ý định bình luận cho một bài viết khác vì bài này không có phiếu bầu (lên hoặc xuống) và vì vậy bình luận dường như không đúng chỗ. Chúc mừng.
hồng y

1
@cardinal +1, thủ thuật hữu ích. Câu hỏi này hóa ra là một tài liệu tham khảo khá tốt.
mpiktas

6

Một cách có thể giúp bạn hiểu là không sử dụng đại số ma trận và phân biệt từng khía cạnh cho từng thành phần và sau đó "lưu trữ" kết quả trong một vectơ cột. Vì vậy chúng tôi có:

βki=1N(Yij=1pXijβj)2=0

Bây giờ bạn có của các phương trình này, một cho mỗi beta. Đây là một ứng dụng đơn giản của quy tắc chuỗi:p

i=1N2(Yij=1pXijβj)1(βk[Yij=1pXijβj])=0
2i=1NXik(Yij=1pXijβj)=0

Bây giờ chúng ta có thể viết lại tổng bên trong dấu ngoặc là Vì vậy, bạn nhận được:j=1pXijβj=xiTβ

i=1NXikYii=1NXikxiTβ=0

Bây giờ chúng ta có của các phương trình này và chúng ta sẽ "xếp chúng" trong một vectơ cột. Lưu ý cách là thuật ngữ duy nhất phụ thuộc vào , vì vậy chúng ta có thể xếp chồng nó vào vectơ và chúng ta nhận được:pXikkxi

i=1NxiYi=i=1NxixiTβ

Bây giờ chúng ta có thể lấy bản beta bên ngoài tổng (nhưng phải ở trên RHS của tổng), và sau đó thực hiện invervse:

(i=1NxixiT)1i=1NxiYi=β
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.