Chức năng ảnh hưởng và OLS


15

Tôi đang cố gắng để hiểu làm thế nào các chức năng ảnh hưởng làm việc. Ai đó có thể giải thích trong bối cảnh hồi quy OLS đơn giản

yi=α+βxi+εi

nơi tôi muốn chức năng ảnh hưởng cho .β


2
Vẫn chưa có câu hỏi cụ thể nào ở đây: bạn có muốn xem hàm ảnh hưởng được tính như thế nào không? Bạn có muốn một ví dụ thực nghiệm cụ thể? Một lời giải thích heuristic về ý nghĩa của nó?
whuber

1
Nếu bạn tra cứu "chức năng ảnh hưởng trong các thành phần chính" của Frank Critchley năm 1986 (không thể nhớ tên chính xác của bài báo). Ông định nghĩa hàm ảnh hưởng cho hồi quy thông thường ở đây (có thể hoặc không thể chứng minh câu trả lời của tôi sai).
xác suất

Câu trả lời:


15

Các chức năng ảnh hưởng về cơ bản là một công cụ phân tích có thể được sử dụng để đánh giá hiệu quả (hoặc "ảnh hưởng") của việc loại bỏ một quan sát về giá trị của một thống kê mà không phải tính lại thống kê đó . Chúng cũng có thể được sử dụng để tạo ước tính phương sai tiệm cận. Nếu ảnh hưởng bằng thì phương sai tiệm cận là I 2I .I2n

Cách tôi hiểu các chức năng ảnh hưởng là như sau. Bạn có một số loại CDF lý thuyết, ký hiệu là . Đối với OLS đơn giản, bạn cóFi(y)=Pr(Yi<yi)

ở đâuΦ(z)là CDF bình thường tiêu chuẩn, vàσ2là phương sai lỗi. Bây giờ bạn có thể chỉ ra rằng bất kỳ số liệu thống kê nào cũng sẽ là một chức năng của CDF này, do đó ký hiệuS(F)(tức là một số chức năng củaF). Bây giờ giả sử chúng ta thay đổi chức năngFbởi một "chút", đểF(i)(z)=(1+ζ)F(z)-ζdelta(i)(

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Φ(z)σ2S(F)FF ở đâu δ i ( z ) = I ( y i < z ) , và ζ = 1F(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z) . Do đó,F(i)đại diện cho CDF của dữ liệu với điểm dữ liệu "ith" bị xóa. Chúng ta có thể làm một loạt taylor củaF(i)(z)vềζ=0. Điều này mang lại:ζ=1n1F(i)F(i)(z)ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

Lưu ý rằng vì vậy chúng tôi nhận được: S [ F ( i ) ( z , ζ ) ] S [ F ( z ) ] + ζ [ S [ F ( i ) ( z , ζ ) ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

Đạo hàm riêng ở đây được gọi là hàm ảnh hưởng. Vì vậy, điều này thể hiện sự điều chỉnh gần đúng "thứ tự đầu tiên" được thực hiện theo thống kê do xóa quan sát "thứ i". Lưu ý rằng trong hồi quy, phần còn lại không chuyển sang trạng thái không đối xứng, do đó đây là giá trị gần đúng với những thay đổi bạn thực sự có thể nhận được. Bây giờ viết như:β

β=1nj=1n(yjy¯)(xjx¯)1nj=1n(xjx¯)2

Do đó, beta là một hàm của hai thống kê: phương sai của X và hiệp phương sai giữa X và Y. Hai thống kê này có các đại diện theo CDF là:

v a r ( X ) = ( X - μ x ( F ) ) 2 d F trong đó μ x = x d F

cov(X,Y)=(Xμx(F))(Yμy(F))dF
var(X)=(Xμx(F))2dF
μx=xdF

FF(i)=(1+ζ)Fζδ(i)

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx)
Var(X)(i)=(Xμx(i))2dF(i)=(Xμx+ζ(xiμx))2d[(1+ζ)Fζδ(i)]

ζ2

Var(X)(i)Var(X)ζ[(xiμx)2Var(X)]
Cov(X,Y)(i)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]

β(i)ζ

β(i)(ζ)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]Var(X)ζ[(xiμx)2Var(X)]

Bây giờ chúng ta có thể sử dụng loạt Taylor:

β(i)(ζ)β(i)(0)+ζ[β(i)(ζ)ζ]ζ=0

Đơn giản hóa điều này mang lại:

β(i)(ζ)βζ[(xiμx)(yiμy)Var(X)β(xiμx)2Var(X)]

μyμxvar(X)ζ=1n1

β(i)βxix¯n1[yiy¯1nj=1n(xjx¯)2βxix¯1nj=1n(xjx¯)2]

x~=xx¯sx

β(i)βxi~n1[yi~sysxxi~β]

Vậy câu chuyện là về ảnh hưởng của điểm dữ liệu bổ sung? Tôi đã quen với đáp ứng xung cho dữ liệu chuỗi thời gian, trong bối cảnh thống kê, mọi ảnh hưởng sẽ được mô tả bằng hiệu ứng cận biên hoặc (lựa chọn tốt hơn) hệ số beta từ hồi quy chuẩn. Vâng, tôi thực sự cần nhiều bối cảnh hơn để đánh giá câu hỏi và câu trả lời, nhưng cái này thì hay, tôi nghĩ vậy (+1 chưa nhưng đang chờ).
Dmitrij Celov

@dmitrij - Đó là những gì được ngụ ý (hoặc những gì tôi đã suy luận) từ liên kết - đó là về các đặc tính mạnh mẽ của một thống kê. Các hàm ảnh hưởng có tổng quát hơn một chút so với 1 điểm dữ liệu - bạn có thể xác định lại hàm delta là tổng của chúng (rất nhiều quan sát). Tôi sẽ nghĩ về nó như một "Jacknife giá rẻ" ở một mức độ nào đó - bởi vì bạn không yêu cầu lắp lại mô hình.
xác suất

10

Đây là một cách siêu chung để nói về các hàm ảnh hưởng của hồi quy. Trước tiên tôi sẽ giải quyết một cách trình bày các chức năng ảnh hưởng:

FΣFϵ(x)

Fϵ(x)=(1ϵ)F+ϵδx
δxΣ{x}Σ

Từ đó, chúng ta có thể định nghĩa hàm ảnh hưởng khá dễ dàng:

θ^Fψi:XΓ

ψθ^,F(x)=limϵ0θ^(Fϵ(x))θ^(F)ϵ

Từ đây, có thể thấy rằng một hàm ảnh hưởng là đạo hàm Gateaux của tại theo hướng . Điều này làm cho việc giải thích các hàm ảnh hưởng (đối với tôi) rõ ràng hơn một chút: Hàm ảnh hưởng cho bạn biết hiệu ứng của một quan sát cụ thể đối với công cụ ước tính. Fδxθ^Fδx

Ước tính OLS là một giải pháp cho vấn đề:

θ^=argminθE[(YXθ)T(YXθ)]

Hãy tưởng tượng một phân phối bị ô nhiễm khiến trọng lượng quan sát cao hơn một chút :(x,y)

θ^ϵ=argminθ(1ϵ)E[(YXθ)T(YXθ)]+ϵ(yxθ)T(yxθ)

Lấy điều kiện đặt hàng đầu tiên:

{(1ϵ)E[XTX]+ϵxTx}θ^ϵ=(1ϵ)E[XTY]+ϵxTy

Vì hàm ảnh hưởng chỉ là một dẫn xuất Gateaux, bây giờ chúng ta có thể nói:

(E[XTX]+xTx)θ^ϵ+E[XTX]ψθ(x,y)=E[XTY]+xTy

Tại , , vì vậy:ϵ=0θ^ϵ=θ^=E[XTX]1E[XTY]

ψθ(x,y)=E[XTX]1xT(yxθ)

Bản sao mẫu hữu hạn của hàm ảnh hưởng này là:

ψθ(x,y)=(1NiXiTXi)1xT(yxθ)

Nói chung, tôi thấy khung này (làm việc với các hàm ảnh hưởng như các dẫn xuất Gateaux) dễ xử lý hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.