Hồi quy góc nhỏ nhất giữ cho các mối tương quan giảm đơn điệu và gắn liền?


9

Tôi đang cố gắng giải quyết vấn đề cho hồi quy góc nhỏ nhất (LAR). Đây là một vấn đề 3.23 trên trang 97 của Hastie và cộng sự, Các yếu tố của học thống kê, thứ 2. chủ biên (In lần thứ 5) .

Xem xét một vấn đề hồi quy với tất cả các biến và đáp ứng có giá trị trung bình bằng 0 và độ lệch chuẩn. Giả sử rằng mỗi biến có tương quan tuyệt đối giống hệt nhau với đáp ứng:

1N|xj,y|=λ,j=1,...,p

Hãy β là hình vuông hệ số nhỏ nhất của y trên X và để cho u ( α ) = α X β cho α [ 0 , 1 ] .β^yXu(α)=αXβ^α[0,1]

Tôi được yêu cầu chỉ ra rằng và tôi đang gặp vấn đề với điều đó. Lưu ý rằng về cơ bản điều này có thể nói rằng mối tương quan của mỗixjvới phần dư vẫn có độ lớn bằng nhau khi chúng ta tiến tớiu.

1N|xj,yu(α)|=(1α)λ,j=1,...,p
xju

Tôi cũng không biết làm thế nào để chỉ ra rằng các mối tương quan bằng:

λ(α)=(1α)(1α)2+α(2α)NRSSλ

Bât cư thông tin được cung câp nao cung được la sự suât hiện tuyệt vơi!


2
@Belmont, là những gì ? Bạn có thể cung cấp thêm bối cảnh về vấn đề của bạn? Liên kết đến bài viết với các thuộc tính tiêu chuẩn của LAR chẳng hạn sẽ giúp ích rất nhiều. u(α)
mpiktas

@Belmont, Điều này có vẻ như là một vấn đề từ Hastie và cộng sự, Các yếu tố của học thống kê , thứ 2. chủ biên Đây có phải là bài tập về nhà không? Nếu vậy, bạn có thể thêm thẻ đó.
Đức hồng y

@Belmont, bây giờ @cardinal đã trả lời đầy đủ, bạn có thể chỉ định LAR thực sự là gì, để tham khảo trong tương lai không? Đánh giá từ câu trả lời này là thao tác chuẩn của các sản phẩm có hồi quy bình phương nhỏ nhất với một số hạn chế ban đầu. Không nên có một cái tên đặc biệt cho nó mà không có lý do nghiêm trọng.
mpiktas

1
@mpiktas, đó là một thuật toán stagewise, vì vậy mỗi lần một biến vào hoặc lá mô hình trên con đường chính quy, kích thước (ví dụ, cardinality / chiều) của phát triển hoặc co lại tương ứng và một ước tính "mới" LS được sử dụng dựa trên các biến hiện đang hoạt động. Trong trường hợp của Lasso, một vấn đề tối ưu hóa lồi, về cơ bản, quy trình này là khai thác cấu trúc đặc biệt trong các điều kiện KKT để có được một giải pháp rất hiệu quả. Ngoài ra còn có các khái quát về, ví dụ, hồi quy logistic dựa trên IRLS và Heine-Borel (để chứng minh sự hội tụ trong số hữu hạn của các bước.)β
hồng y

1
@Belmont -1, vì gần đây tôi đã mua cuốn sách của Hastie, tôi có thể xác nhận rằng đây là một bài tập từ nó. Vì vậy, tôi đang cho bạn một -1 lớn, vì bạn thậm chí không quản lý để đưa ra tất cả các định nghĩa, tôi thậm chí không nói về việc đưa ra tài liệu tham khảo.
mpiktas

Câu trả lời:


21

Đây là vấn đề 3.23 trên trang 97 của Hastie và cộng sự, Các yếu tố của học thống kê , thứ 2. chủ biên (In lần thứ 5) .

Chìa khóa của vấn đề này là sự hiểu biết tốt về bình phương tối thiểu thông thường (nghĩa là hồi quy tuyến tính), đặc biệt là tính trực giao của các giá trị được trang bị và phần dư.

Xn×pyβXββ^=(XTX)1XTyy^=X(XTX)1XTyy^,yy^=y^T(yy^)=0XT(yy^)=XTyXTX(XTX)1XTy=XTyXTy=0

xjxjjX

  • 1Nxj,xj=1j1Ny,y=1
  • 1Nxj,1p=1Ny,1p=01pp
  • 1N|xj,y|=λj

xj,yy^=0j


Các mối tương quan được gắn

u(α)=αXβ^=αy^

xj,yu(a)=xj,(1α)y+αyαy^=(1α)xj,y+αxj,yy^,
1N|xj,yu(α)|=(1α)λ,
ρ^j(α)=1N|xj,yu(α)|1Nxj,xj1Nyu(α),yu(α)=(1α)λ1Nyu(α),yu(α)

jxjy

αp


Hình thức rõ ràng của mối tương quan (tuyệt đối)

yu(α),yu(α)=(1α)y+αyu(α),(1α)y+αyu(α).

u(α)=αy^

yu(α),yu(α)=(1α)2y,y+2α(1α)y,yy^+α2yy^,yy^.

Quan sát rằng

  • y,y=N
  • y,yy^=yy^,yy^+y^,yy^=yy^,yy^
  • yy^,yy^=RSS

Đặt tất cả những thứ này lại với nhau, bạn sẽ nhận thấy rằng chúng tôi nhận được

ρ^j(α)=(1α)λ(1α)2+α(2α)NRSS=(1α)λ(1α)2(1RSSN)+1NRSS

1RSSN=1N(y,y,yy^,yy^)0ρ^j(α)αρ^j(α)0α1


Phần kết : Tập trung vào các ý tưởng ở đây. Thực sự chỉ có một. Các lemma trực giao thực hiện hầu hết các công việc cho chúng tôi. Phần còn lại chỉ là đại số, ký hiệu và khả năng đưa hai cái cuối cùng này hoạt động.


2
@ thẻ, +1. Câu trả lời là cường độ tốt hơn câu hỏi.
mpiktas

@cardinal, bạn có thể muốn thay đổi liên kết đến amazon hoặc một số trang web khác. Tôi nghĩ rằng việc liên kết đến toàn bộ cuốn sách có thể gây ra một số vấn đề bản quyền.
mpiktas

3
@mpiktas, không. Không có vấn đề bản quyền. Đó là trang web chính thức cho cuốn sách. Các tác giả đã nhận được sự cho phép từ Springer để cung cấp PDF miễn phí trực tuyến. (Xem ghi chú về hiệu ứng này trên trang web.) Tôi nghĩ rằng họ đã có ý tưởng từ Stephen Boyd và văn bản Tối ưu hóa lồi của anh ấy . Hy vọng xu hướng như vậy sẽ lấy hơi trong vài năm tới. Thưởng thức!
Đức hồng y

@cardinal, ooh cảm ơn rất nhiều! Đó là hào phóng hào phóng từ các tác giả.
mpiktas

@mpiktas, cho đến nay là cuốn sách phổ biến nhất trong Sê-ri Springer về Thống kê. Nó trông tốt trên iPad. Điều đó nhắc nhở tôi --- Tôi cũng nên tải văn bản của Boyd lên đó. Chúc mừng.
Đức hồng y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.