Kỳ vọng có điều kiện của bình phương R


16

Hãy xem xét mô hình tuyến tính đơn giản:

yy=Xββ+ϵ

trong đó ϵii.i.d.N(0,σ2)XRn×p ,p2X chứa một cột của hằng số.

Câu hỏi của tôi là, cho E(XX) , βσ , là có một công thức cho một tổ chức phi tầm thường trên ràng buộc trên E(R2) *? (giả sử mô hình được ước tính bởi OLS).

* Tôi giả sử, viết cái này, rằng nhận E(R2) sẽ không thể thực hiện được.

EDIT1

sử dụng giải pháp có nguồn gốc từ Stéphane Laurent (xem bên dưới), chúng ta có thể có được giới hạn trên không tầm thường trên E(R2) . Một số mô phỏng số (bên dưới) cho thấy ràng buộc này thực sự khá chặt chẽ.

Stéphane Laurent có nguồn gốc như sau: R2B(p1,np,λ) nơi B(p1,np,λ) là một phân phối Beta phi trung tâm với trung tâm phi tham số λ với

λ=||XβE(X)β1n||2σ2

Vì thế

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

nơi là một tổ chức phi trung tâm χ 2 với tham số λk bậc tự do. Vì vậy, một giới hạn trên không tầm thường đối với E ( R 2 )χk2(λ)χ2λkE(R2)

λ+p1λ+n1

rất chặt chẽ (chặt chẽ hơn nhiều so với những gì tôi dự kiến ​​sẽ có thể):

ví dụ: sử dụng:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

giá trị trung bình của trên 1000 mô phỏng là . Các lý thuyết trên ràng buộc trên cho . Các ràng buộc dường như chính xác như nhau trên nhiều giá trị của R 2 . Thật đáng kinh ngạc!R20.9608190.9609081R2

EDIT2:

sau khi nghiên cứu sâu hơn, nó xuất hiện rằng chất lượng của xấp xỉ ràng buộc trên để sẽ nhận được tốt hơn như λ + p tăng (và tất cả như nhau, khác λ tăng với n ).E(R2)λ+pλn


có phân phối Beta với các tham số chỉ phụ thuộc vào n p . Không R2np
Stéphane Laurent

1
Xin lỗi, tuyên bố trước đây của tôi chỉ đúng theo giả thuyết về "mô hình null" (chỉ chặn). Mặt khác, phân phối của phải giống như phân phối Beta không trung tính, với tham số không trung tính liên quan đến các tham số chưa biết. R2
Stéphane Laurent

@ StéphaneLaurent: cảm ơn. Bạn có biết thêm về mối quan hệ giữa các tham số chưa biết và các tham số của Beta không? Tôi bị kẹt, vì vậy mọi con trỏ sẽ được chào đón ...
user603

Bạn có thực sự cần phải đối phó với không? Có lẽ có một công thức chính xác đơn giản cho E [ R 2 / ( 1 - R 2 ) ] . E[R2]E[R2/(1R2)]
Stéphane Laurent

1
Với các ký hiệu của câu trả lời của tôi, đối với một số vô hướng k và khoảnh khắc đầu tiên của phân phối F không tập trung là đơn giản. R2/(1R2)=kFkF
Stéphane Laurent

Câu trả lời:


12

Bất kỳ mô hình tuyến tính có thể được viết nơi G có phân phối chuẩn tiêu chuẩn trên R nμ được giả định là thuộc về một không gian con W của R n . Trong trường hợp của bạn W = Im ( XY=μ+σGGRnμWRnW=Im(X) .

Hãy là một chiều không gian con sinh ra bởi các vector ( 1 , 1 , ... , 1 ) . Lấy U = [ 1 ] dưới đây, R 2 được đánh giá cao có liên quan đến cổ điển Fisher thống kê F = P Z Y 2 / ( m - )[1]W(1,1,,1)U=[1]R2 cho thử nghiệm giả thuyết củaH0:{LU}nơiUWlà một không gian con, và biểu thị bởi Z=UWsự bổ sung trực giao củaUtrongW, và biểu thịm=dim(W)=dim(U)

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U) (sau đó = 1 trong tình huống của bạn).m=p=1

Thật vậy, vì định nghĩa củaR2R2=P Z Y 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

Rõ ràng P W Y = σ P W G .PZY=PZμ+σPZGPWY=σPWG

Khi là đúngH0:{μU} rồi và do đó F = P Z G 2 / ( m - )PZμ=0 có FisherFm-,n-mphân phối. Do đó, từ mối quan hệ cổ điển giữa phân bố Fisher và phân phối Beta,R2~B(m-,n-m).

F=PZG2/(m)PWG2/(nm)Fm,nm
Fm,nmR2B(m,nm)

Trong tình hình chung chúng ta phải đối phó với khi P Z L 0 . Trong trường hợp một chung này có P Z Y 2 ~ σ 2 χ 2 m - ( λ ) , các noncentral χ 2 phân phối với m - bậc tự do và noncentrality tham số λ = PZY=PZμ+σPZGPZμ0PZY2σ2χm2(λ)χ2mλ=PZμ2σ2FFm,nm(λ)F -tests.

R2mnmλ . Tôi nghĩ rằng những khoảnh khắc có sẵn trong tài liệu nhưng chúng có thể rất phức tạp.

PZμPZ=PWPU. One has PUμ=μ¯1 when U=[1], and PWμ=μ. Hence PZμ=μμ¯1 where here μ=Xβ for the unknown parameters vector β.


1
PZx is the orthogoanl projection of x on the linear subspace Z. And P denotes projection on the orthogonal.
Stéphane Laurent

1
Beware of PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
μ¯=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.