Hồi quy tuyến tính khi bạn chỉ biết , không phải trực tiếp


13

Giả sử .Xβ=Y

Chúng tôi không biết chính xác, chỉ có sự tương quan của nó với mỗi dự đoán, .X t YYXtY

Giải pháp bình phương nhỏ nhất (OLS) là và không có vấn đề gì.β=(XtX)1XtY

Nhưng giả sử ở gần số ít (đa cộng tuyến) và bạn cần ước tính tham số sườn núi tối ưu. Tất cả các phương pháp dường như cần các giá trị chính xác của .XtXY

Có phương pháp nào khác không khi chỉ biết ?XtY


câu hỏi thú vị Có lẽ một số loại thuật toán EM sẽ hoạt động ...
xác suất

Tôi không hiểu, bạn không thể sử dụng xác thực chéo để ước tính tham số sườn núi tối ưu?
Pardis

@Pardis: Không có chức năng mất nào được đưa ra trong câu hỏi vì vậy chúng tôi không biết phương tiện tối ưu là gì. Bạn có thể thấy những rắc rối chúng ta gặp phải nếu chức năng mất là MSE không?
Đức hồng y

1
@JohnSmith: Bạn đang ám chỉ đến điểm mà tôi đang lái xe. Không có chỉ dẫn về cách đo lường "sự tối ưu". Những gì bạn đang làm một cách hiệu quả là giới thiệu một số liệu khác nhau (hàm khoảng cách) để đo lường "chất lượng" của dự đoán hoặc mức độ phù hợp. Chúng tôi cần thêm thông tin chi tiết từ OP để đi rất xa, tôi nghi ngờ.
Đức hồng y

1
@Pardis: Tìm các ước tính không phải là vấn đề, như bạn lưu ý. :) Tuy nhiên, nếu bạn quyết định thực hiện xác định giá trị chéo, bạn sẽ ước tính MSE ngoài mẫu như thế nào, ở nếp gấp bên trái cho mỗi lần lặp? :)
Đức hồng y

Câu trả lời:


8

Đây là một câu hỏi thú vị. Đáng ngạc nhiên, có thể làm một cái gì đó theo các giả định nhất định, nhưng có khả năng mất thông tin về phương sai còn lại. Nó phụ thuộc vào mất bao nhiêu.X

Hãy xem xét các giá trị phân hủy ít sau của với một ma trận với các cột trực giao, một đường chéo ma trận với các giá trị đặc biệt tích cực theo đường chéo và a ma trận trực giao. Sau đó, các cột của tạo thành một cơ sở trực giao cho không gian cột của và là vectơ của các hệ số cho phép chiếu lên không gian cột này khi được mở rộng trong X U n × p D d 1d 2. . . d p > 0 V p × p U X Z = U t Y = D - 1 V t V D U t Y = D - 1 V t X t Y Y U Z XX=UDVtXBạnn×pDd1d2...dp>0Vp×pBạnX

Z= =BạntY= =D-1VtVDBạntY= =D-1VtXtY
YBạnCơ sở U. Từ công thức chúng ta thấy rằng là tính toán từ kiến thức của và chỉ.ZXXtY

Vì công cụ dự báo hồi quy sườn cho một có thể được tính là chúng ta thấy rằng các hệ số của công cụ dự báo hồi quy sườn trong cơ sở -column là Bây giờ chúng ta hãy giả định phân phối mà có trung bình chiều và hiệp phương sai ma trận . Khi đó có -dimensional có nghĩa là và ma trận hiệp phương sai . Nếu chúng ta tưởng tượng một độc lậpY = X ( X t X + λ tôi ) - 1 X t Y = U D ( D 2 + λ tôi ) - 1 D U t Y = U D ( D 2 + λ tôi ) - 1 D Z U Z = D ( D 2 + λ tôi ) -λ

Y^= =X(XtX+λTôi)-1XtY= =BạnD(D2+λTôi)-1DBạntY= =BạnD(D2+λTôi)-1DZ
BạnYnξ σ 2 Tôi n Zp U t ξ σ 2 Tôi p Y New YX Z mới = U t Y New Z E | | Y New - Y | | 2
Z^= =D(D2+λTôi)-1DZ.
Ynξσ2TôinZpBạntξσ2TôipYMới có cùng phân phối với (mọi thứ có điều kiện trên từ đây), có cùng phân phối dưới dạng và độc lập và Ở đây, đẳng thức thứ ba theo sau tính trực giao của và và thứ tư bởi thực tế làYXZMới= =BạntYMớiZYmới-UZNewUZmới-U Z U
E||YMới-Y^||2= =E||YMới-BạnZMới+BạnZMới-BạnZ^||2= =E||YMới-BạnZMới||2+E||BạnZMới-BạnZ^||2= =Ơ0+E||ZMới-Z^||2.
YMới-BạnZMớiBạnZMới-BạnZ^Bạn có các cột trực giao. Số lượng là một lỗi mà chúng tôi không thể nhận được bất kỳ thông tin nào, nhưng nó cũng không phụ thuộc vào . Để giảm thiểu lỗi dự đoán ở phía bên trái, chúng ta phải giảm thiểu thuật ngữ thứ hai ở phía bên tay phải. λƠ0λ

Bằng cách tính toán tiêu chuẩn Ở đây được gọi là mức độ tự do hiệu quả cho hồi quy sườn với tham số . Công cụ ước tính không thiên vị của là df(λ)λE| | Z-Z| | 2sai(λ)=| | Z-Z| | 2=pΣi=1(1-d2i

E||ZMới-Z^||2= =E||Z-Z^||2+2ΣTôi= =1pcov(ZTôi,Z^Tôi)= =E||Z-Z^||2+2σ2ΣTôi= =1pdTôi2dTôi2+λdf(λ).
df(λ)λE||Z-Z^||2
lỗi(λ)= =||Z-Z^||2= =ΣTôi= =1p(1-dTôi2dTôi2+λ)2ZTôi2.

Chúng tôi kết hợp điều này với công cụ ước tính (không thiên vị) của cho rằng chúng ta biết , sau đó chúng ta cần giảm thiểu. Rõ ràng, điều này chỉ có thể được thực hiện nếu chúng ta biết hoặc có dự đoán hợp lý tại hoặc ước tính của .E | | Z mới - Z | | 2 σ 2 σ 2 σ 2

lỗi(λ)+2σ2df(λ)
E||ZMới-Z^||2σ2σ2σ2

Ước tính có thể có nhiều vấn đề hơn. Có thể chỉ ra rằng Do đó, nếu có thể chọn nhỏ đến mức có thể bỏ qua sai lệch bình phương, chúng ta có thể thử ước tính là Nếu ý chí làm việc này phụ thuộc rất nhiều vào . E | | Z - Z | | 2 = σ 2 ( p - p i = 1 d 2 iσ2bước sóngσ2σ2=1

E||Z-Z^||2= =σ2(p-ΣTôi= =1pdTôi2dTôi2+λ(2-dTôi2dTôi2+λ)d(λ))+Thiên kiến(λ)2.
λσ2X
σ^2= =1p-d(λ)||Z-Z^||2.
X

Để biết một số chi tiết, hãy xem Phần 3.4.1 và Chương 7 trong ESL hoặc thậm chí tốt hơn Chương 2 trong GAM .


0

Xác định như trong câu hỏi và cho các tham số khác nhau và đặt của nhãn mẫu. Sau đó, có thể tính toán được vì không biết rớt ra khi mở rộng cả hai định mức.ββ(λ,K)= =[(XTX)KK+λTôi]-1(XTY)KλKe(λ,K): =Xβ(λ,K)-Y2-Xβ-Y2Y2

Điều này dẫn đến thuật toán sau:

  • Tính đối với một số lựa chọn của tập huấn luyện .e(λ,K)K
  • Vẽ các kết quả như là một hàm của .λ
  • Chấp nhận giá trị của trong đó cốt truyện là phẳng nhất.λ
  • Sử dụng làm ước tính cuối cùng.β*= =[XTX+λTôi]-1XTY

1
Tôi đoán "nơi cốt truyện là phẳng nhất" sẽ ở rất nhỏ, giống như khoảng 0 :)λ
jbowman

@jbowman: Điều này sẽ chỉ xảy ra nếu sự cố được điều hòa tốt và không cần chính quy, thì thực sự là đủ. Trong trường hợp không có điều kiện, dự đoán của các vật phẩm bên ngoài sẽ kém vì quá nhiều và sẽ rất lớn. λ= =0Ke(λ,K)
Arnold Neumaier

3
@ArnoldNeumaier: không thể tính toán được. Chúng tôi chỉ biết mối tương quan với từng yếu tố dự đoán. nằm trong "miền dự đoán", không thuộc "miền Y" (Nếu N là cỡ mẫu và p số lượng dự đoán, chúng ta chỉ có giá trị p, một giá trị cho mỗi dự đoán). (XTY)K(XTY)
Jag

@Jag: Sau đó, không có đủ thông tin để chọn . Nhưng phải được thu thập bằng cách nào đó. Nếu trong quá trình thu thập, bạn phân vùng mẫu thành lô và lắp ráp riêng cho từng lô thì người ta có thể dự trữ một lô cho mỗi lô để xác thực chéo. λXTYkXTY
Arnold Neumaier

@ArnoldNeumaier: được cung cấp bên ngoài, không được thu thập. XTY
Jag
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.