Cho thấy rằng công cụ ước tính OLS là quy mô tương đương?


11

Tôi không có định nghĩa chính thức về tương đương quy mô, nhưng đây là những gì Giới thiệu về Học thống kê nói về điều này trên trang. 217:

Các hệ số bình phương tối thiểu tiêu chuẩn ... là tương đương tỷ lệ : nhân với hằng số chỉ đơn giản dẫn đến một tỷ lệ ước tính hệ số bình phương nhỏ nhất với hệ số .Xjc1/c

Để đơn giản, hãy giả sử mô hình tuyến tính chung , trong đó \ mathbf {y} \ in \ mathbb {R} ^ N , \ mathbf {X } là ma trận N \ lần (p + 1) (trong đó p + 1 <N ) với tất cả các mục trong \ mathbb {R} , \ boldsymbol \ beta \ in \ mathbb {R} ^ {p + 1}\ boldsymbol \ epsilon là một vectơ N chiều gồm các biến ngẫu nhiên có giá trị thực với \ mathbb {E} [\ boldsymbol \ epsilon] = \ mathbf {0} _ {N \ lần 1} .y=Xβ+ϵyRNXN×(p+1)p+1<NRβRp+1ϵNE[ϵ]=0N×1

Từ ước tính OLS, chúng tôi biết rằng nếu X có thứ hạng (cột) đầy đủ,

β^X=(XTX)1XTy.
Giả sử chúng tôi đã nhân một cột của X , giả sử xk cho một số k{1,2,,p+1} , bằng một hằng số c0 . Điều này sẽ tương đương với ma trận
X[111c11]S=[x1x2cxkxp+1]X~
trong đó tất cả các mục nhập khác của ma trận S ở trên là 0c nằm trong mục thứ k của đường chéo của S . Sau đó,X~X~vì ma trận thiết kế mới là
β^X~=(X~TX~)1X~Ty.
Sau một số công việc, người ta có thể chỉ ra rằng
X~TX~=[x1Tx1x1Tx2cx1Txkx1Txp+1x2Tx1x2Tx2cx2Txkx2Txp+1cxkTx1cxkTx2c2xkTxkcxkTxp+1xp+1Tx1xp+1Tx2cxp+1Txp+1xp+1Txp+1]
\ cdots & \ mathbf {x} _ {p + 1} ^ {T} \ mathbf {x} _ {p + 1} \\ \ end {bmatrix} và
X~Ty=[x1Tyx2TycxkTyxp+1Ty]
Làm thế nào để tôi đi từ đây để hiển thị khiếu nại được trích dẫn ở trên (nghĩa là β^X~=1cβ^X )? Tôi không rõ cách tính toán (X~TX~)1 .

Tôi nghĩ rằng không đúng, nó thiếu một số nhân trong một hàng. cX~TX~c
Firebug

1
Ngoài ra, hãy nhớ rằng yêu cầu là , không phải mọi . ββ^k,new=1cβ^k,oldβ
Firebug

@Fireorms Yep, tôi chỉ cần tìm ra điều đó. Tôi đang đăng một câu trả lời.
Clarinetist

2
Bạn có thể thay thế tất cả đại số này bằng phân tích đơn vị đơn giản hơn nhiều, vì nhân với chỉ thay đổi đơn vị đo lường của nó, và do đó, thay đổi tương ứng trong các đơn vị được liên kết với hệ số của nó là chia nó cho . Điều đó không chứng minh phải được chia cho , thật không may. Tuy nhiên, chuỗi suy nghĩ này có thể nhắc nhở chúng ta rằng nhiều hồi quy có thể được thực hiện bằng một chuỗi hồi quy chống lại một biến hồi quy tại một thời điểm, trong đó rõ ràng là được chia cho , và do đó bằng chứng đã hoàn thành. c β j c β j c β jXjcβjcβ^jcβ^jc
ai

@whuber, trong khi trực giác cho kết quả là rõ ràng, có vẻ như đơn giản là phải có một chút đại số trong việc cung cấp một bằng chứng. Rốt cuộc, hệ số tỷ lệ cần phải được đảo ngược. c
user795305

Câu trả lời:


11

Vì khẳng định trong trích dẫn là tập hợp các câu lệnh về việc định cỡ lại các cột của , nên bạn cũng có thể chứng minh tất cả chúng cùng một lúc. Thật vậy, không cần phải làm gì thêm để chứng minh một khái quát của khẳng định:X

Khi được nhân phải bởi ma trận khả nghịch , thì ước tính hệ số mới bằng với nhân với .Một β MộtXAβ^A Một-1β^A1

Các sự kiện đại số duy nhất bạn cần là (những điều dễ dàng được chứng minh, nổi tiếng) mà cho bất kỳ ma trận và cho các ma trận khả nghịch và . (Cần có phiên bản phụ của cái sau khi làm việc với các nghịch đảo tổng quát: cho và không thể đảo ngược và bất kỳ , . ) A B ( A B ) - 1 = B - 1 Một - 1 Một B Một B X ( Một X B ) - = B - 1 X - Một - 1(AB)=BAAB(AB)1=B1A1ABABX(AXB)=B1XA1


Chứng minh bằng đại số :

β^A=((XA)((XA))(XA)y=A1(XX)(A)1Ay=A1β^,

QED. (Để bằng chứng này hoàn toàn tổng quát, siêu ký tự đề cập đến một nghịch đảo tổng quát.)


Chứng minh bằng hình học :

Cho các cơ sở và của và , tương ứng, đại diện cho một phép biến đổi tuyến tính từ sang . Phép nhân phải của với có thể được coi là cố định biến đổi này nhưng thay đổi thành (nghĩa là thành các cột của ). Theo sự thay đổi cơ sở đó, biểu diễn của bất kỳ vectơ phải thay đổi thông qua phép nhân trái của ,E nEpEnR p X R p R n XMột E p Một E p Một beta R p Một - 1RnRpXRpRnXAEpAEpAβ^RpA1QED .

(Bằng chứng này hoạt động, không thay đổi, ngay cả khi không thể đảo ngược.)XX


Báo giá đề cập cụ thể đến trường hợp ma trận đường chéo với cho và .A i i = 1 i j A j j = cAAii=1ijAjj=c


Kết nối với bình phương tối thiểu

Mục tiêu ở đây là sử dụng các nguyên tắc đầu tiên để thu được kết quả, với nguyên tắc là bình phương tối thiểu: ước tính các hệ số làm giảm thiểu tổng bình phương của phần dư.

Một lần nữa, việc chứng minh một khái quát (rất lớn) chứng tỏ không còn khó khăn nữa và khá lộ liễu. Giả sử là bất kỳ bản đồ nào (tuyến tính hay không) của không gian vectơ thực và giả sử là bất kỳ hàm có giá trị thực nào trên . Đặt là tập hợp các điểm (có thể trống) mà được thu nhỏ. Q W n U V p v Q ( ϕ ( v ) )

ϕ:VpWn
QWnUVpvQ(ϕ(v))

Kết quả: , được xác định duy nhất bởi và , không phụ thuộc vào bất kỳ lựa chọn cơ sở nào được sử dụng để biểu diễn các vectơ trong .Q ϕ EUQϕV pEpVp

Chứng minh: QED.

Không có gì để chứng minh!

Áp dụng kết quả: Đặt là dạng bậc hai bán nguyệt dương trên , hãy để và giả sử là bản đồ tuyến tính được biểu thị bởi khi căn cứ của và được chọn. Xác định . Chọn một cơ sở của và giả sử là đại diện của một số trong cơ sở đó. Đây là bình phương tối thiểu : thu nhỏ khoảng cách bình phương . VìR n y R n φ X V p = R p W n = R n Q ( x ) = F ( y , x ) R p β v U x = X β F ( y , x ) X R p X Một β Một - 1FRnyRnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^vUx=Xβ^F(y,x)Xlà một biến đổi tuyến tính, thay đổi cơ sở tương ứng với phải nhân bởi một số ma trận khả nghịch . Điều đó sẽ nhân trái với , QED .RpXAβ^A1


6

Xác định công cụ ước lượng bình phương nhỏ nhất , trong đó ma trận thiết kế là thứ hạng đầy đủ. Giả sử ma trận chia tỷ lệ là không thể đảo ngược. XRn×pSRp×pβ^=argminβRpyXβ22XRn×pSRp×p

Xác định công cụ ước tính tỷ lệ mới này . Điều này có nghĩa là cho tất cả . Xác định , chúng ta có thể viết lại bất đẳng thức được hiển thị ở trên dưới dạng cho tất cả . Do đó và theo đó là công cụ ước lượng bình phương nhỏ nhất Do tính không khả dụng của ma trận chia tỷ lệy-XS ~ α 2 2 <α~=argminαRpyXSα22 α ~ α ~ β = S ~ αy - X ~

yXSα~22<yXSα22
αα~β~=Sα~ β ~ β ~ β = arg min β R py - X β 2 2 β = ~ β = S ~ α . S ~ α = S - 1 beta beta k t h 1
yXβ~22<yXβ22
ββ~β~=argminβRpyXβ22
β^=β~=Sα~.
S, theo sau đó . Trong trường hợp của chúng tôi, điều này chỉ khác với bởi mục nhập được chia tỷ lệ bởi .α~=S1β^β^kth1c

1
Tôi không quen vì tôi nên làm việc với và các hàm tương tự - bạn có thể giải thích sự chuyển đổi từ dòng phương trình thứ hai sang thứ ba không? arg min
Clarinetist

Tôi đã viết nó một chút khác nhau, mà sẽ làm cho các bước rõ ràng hơn.
user795305

Điều này thực sự thông minh. (+1)
Clarinetist

4

Tôi đã tìm ra điều này sau khi đăng câu hỏi. Tuy nhiên, nếu công việc của tôi là chính xác, tôi đã hiểu sai yêu cầu. Tỷ lệ chỉ xảy ra trên một thành phần của tương ứng với cột của được nhân với . βXc1cβXc

Lưu ý rằng , trong ký hiệu ở trên, là ma trận đường chéo, đối xứng và có nghịch đảo (vì nó là đường chéo) Lưu ý rằng là ma trận . Giả sử rằng ( p + 1 ) × ( p + 1 ) S - 1 = [ 1S(p+1)×(p+1)( ˜ X T ˜ X )-1(p+1)×(p+1)(XTX)-1=[TXS]-1=(STXTXS)-1=(SXTXS)

S1=[1111c11].
(X~TX~)1(p+1)×(p+1)( ˜ X T˜ X )-1=[(XS)
(XTX)1=[z1z2zkzp+1].
(X~TX~)1=[(XS)TXS]1=(STXTXS)1=(SXTXS)1=S1(XTX)1S1.
Do đó, và nhân số này với có tác dụng tương tự như việc nhân với đã làm - nó vẫn giữ nguyên, được nhân với
S1(XTX)1=[z1z21czkzp+1]
S1XS1czk1c : Do đó,
S1(XTX)1S1=[z1z21c2zkzp+1].
β^X~=S1(XTX)1S1(XS)Ty=[z1z21c2zkzp+1][x1Tyx2TycxkTyxp+1Ty]=[z1x1Tyz2x2Ty1czkxkTyzp+1xp+1Ty]
như mong muốn.

Có một lỗi đánh máy trong . Bạn cần hoán vị . S1(XTX)1S1(XS)y(XS)
JohnK

3

Bằng chứng tầm thường nhất từng có

Bạn bắt đầu với phương trình tuyến tính của mình: Bây giờ bạn muốn thay đổi quy mô của các biến hồi quy của mình, có thể chuyển đổi từ hệ mét sang Imperial, bạn biết kilogam thành pound, mét sang yard, v.v. với ma trận chuyển đổi trong đó mỗi là hệ số chuyển đổi cho biến (cột) trong ma trận thiết kế .

Y=Xβ+ε
S=diag(s1,s1,,sn)siiX

Hãy viết lại phương trình:

Y=(XS)(S1β)+ε

Bây giờ rất rõ ràng rằng tỷ lệ là thuộc tính của tuyến tính của phương trình của bạn, không phải là phương pháp ước tính hệ số OLS. Bất kể phương pháp ước lượng nào có phương trình tuyến tính, bạn đều biết rằng khi các biến hồi quy được chia tỷ lệ là các hệ số mới của bạn sẽ được chia tỷ lệ thànhXSS1β

Bằng chứng đại số chỉ cho OLS

Mở rộng quy mô là: nơi yếu tố quy mô của mỗi biến (cột), và là một phiên bản thu nhỏ của . Hãy gọi ma trận tỷ lệ đường chéo . Công cụ ước tính OLS của bạn là Hãy cắm ma trận tỷ lệ thay vì và sử dụng một số đại số ma trận : Vì vậy, bạn thấy hệ số mới chỉ đơn giản là hệ số cũ được thu nhỏ lại, như mong đợi.

Z=Xdiag(s1,s2,...,sn)
siZXSdiag(s1,s2,...,sn)
β^=(XTX)1XTY
ZX
(ZTZ)1ZTY=(STXTXS)1STXTY=S1(XTX)1S1SXTY=S1(XTX)1XTY=S1β^

2
Tôi thích cách tiếp cận của bạn, nhưng không bị thuyết phục bởi "bằng chứng tầm thường nhất từng có." Bạn đã mặc nhiên giả định và vẫn cần phải trình bày rằng mô hình viết lại phải có cùng mức độ phù hợp với bản gốc. Để đặt nó chặt chẽ hơn: nếu chúng ta xem một quy trình phù hợp là một hàm , trong đó là tập hợp tất cả các dữ liệu có thể (mà chúng ta có thể viết là cặp theo thứ tự ) và là tập hợp tất cả các ước tính hệ số có thể, sau đó bạn cần chứng minh rằng cho tất cả các khả nghịch , tất cả , và tất cả . (Điều này không phải lúc nào cũng đúng!)δ:MRpM(X,Y)Rpδ(X,Y)=S1δ(XS,Y)SXY
whuber

@whuber, thực ra đó là một cách khác: quy trình phù hợp hợp lý sẽ thỏa mãn điều kiện này, nếu không, việc thay đổi đơn vị đo lường đơn giản sẽ tạo ra một dự báo / ước tính khác. Tôi sẽ cập nhật câu trả lời của mình, sẽ suy nghĩ một chút
Aksakal

Tôi đồng ý - nhưng tôi có thể tưởng tượng các trường hợp ngoại lệ trong trường hợp không đủ thứ hạng. Đó là những gì gợi ý cho tôi tình hình không quá tầm thường như nó có vẻ như vậy. X
whuber

3
hoàng người bạn đời, không phải hoàng ...: D (Nice câu trả lời, +1)
usεr11852

@ usεr11852, hôm nay tôi đã học được vài thứ :)
Aksakal

2

Một cách dễ dàng để có kết quả này là nhớ rằng là hình chiếu của trên không gian cột của là vectơ của các hệ số khi được biểu thị dưới dạng tuyến tính sự kết hợp của các cột của . Nếu một số cột được chia tỷ lệ theo hệ số , thì rõ ràng hệ số tương ứng trong tổ hợp tuyến tính phải được chia tỷ lệ .y^yX. β^y^Xc1/c

Đặt là các giá trị của và là các giá trị của giải pháp OLS khi một cột được chia tỷ lệ theoβ một i c . b 1 x 1 + . . . + b i x i + . . . + b mbiβ^aic.

b1x1+...+bixi+...+bmxm=a1x1+...ai(cxi)+...+anxn

ngụ ý rằng trong đó và , giả sử rằng các cột của là độc lập tuyến tính. j i b i = a i c Xbj=ajjibi=aicX

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.