Tôi đang cố gắng để hiểu làm thế nào các chức năng ảnh hưởng làm việc. Ai đó có thể giải thích trong bối cảnh hồi quy OLS đơn giản
nơi tôi muốn chức năng ảnh hưởng cho .
Tôi đang cố gắng để hiểu làm thế nào các chức năng ảnh hưởng làm việc. Ai đó có thể giải thích trong bối cảnh hồi quy OLS đơn giản
nơi tôi muốn chức năng ảnh hưởng cho .
Câu trả lời:
Các chức năng ảnh hưởng về cơ bản là một công cụ phân tích có thể được sử dụng để đánh giá hiệu quả (hoặc "ảnh hưởng") của việc loại bỏ một quan sát về giá trị của một thống kê mà không phải tính lại thống kê đó . Chúng cũng có thể được sử dụng để tạo ước tính phương sai tiệm cận. Nếu ảnh hưởng bằng thì phương sai tiệm cận là I 2 .
Cách tôi hiểu các chức năng ảnh hưởng là như sau. Bạn có một số loại CDF lý thuyết, ký hiệu là . Đối với OLS đơn giản, bạn có
ở đâuΦ(z)là CDF bình thường tiêu chuẩn, vàσ2là phương sai lỗi. Bây giờ bạn có thể chỉ ra rằng bất kỳ số liệu thống kê nào cũng sẽ là một chức năng của CDF này, do đó ký hiệuS(F)(tức là một số chức năng củaF). Bây giờ giả sử chúng ta thay đổi chức năngFbởi một "chút", đểF(i)(z)=(1+ζ)F(z)-ζdelta(i)(
Lưu ý rằng vì vậy chúng tôi nhận được: S [ F ( i ) ( z , ζ ) ] ≈ S [ F ( z ) ] + ζ [ ∂ S [ F ( i ) ( z , ζ ) ]
Đạo hàm riêng ở đây được gọi là hàm ảnh hưởng. Vì vậy, điều này thể hiện sự điều chỉnh gần đúng "thứ tự đầu tiên" được thực hiện theo thống kê do xóa quan sát "thứ i". Lưu ý rằng trong hồi quy, phần còn lại không chuyển sang trạng thái không đối xứng, do đó đây là giá trị gần đúng với những thay đổi bạn thực sự có thể nhận được. Bây giờ viết như:
Do đó, beta là một hàm của hai thống kê: phương sai của X và hiệp phương sai giữa X và Y. Hai thống kê này có các đại diện theo CDF là:
và v a r ( X ) = ∫ ( X - μ x ( F ) ) 2 d F trong đó μ x = ∫ x d F
Bây giờ chúng ta có thể sử dụng loạt Taylor:
Đơn giản hóa điều này mang lại:
Đây là một cách siêu chung để nói về các hàm ảnh hưởng của hồi quy. Trước tiên tôi sẽ giải quyết một cách trình bày các chức năng ảnh hưởng:
Từ đó, chúng ta có thể định nghĩa hàm ảnh hưởng khá dễ dàng:
Từ đây, có thể thấy rằng một hàm ảnh hưởng là đạo hàm Gateaux của tại theo hướng . Điều này làm cho việc giải thích các hàm ảnh hưởng (đối với tôi) rõ ràng hơn một chút: Hàm ảnh hưởng cho bạn biết hiệu ứng của một quan sát cụ thể đối với công cụ ước tính. Fδx
Ước tính OLS là một giải pháp cho vấn đề:
Hãy tưởng tượng một phân phối bị ô nhiễm khiến trọng lượng quan sát cao hơn một chút :
Lấy điều kiện đặt hàng đầu tiên:
Vì hàm ảnh hưởng chỉ là một dẫn xuất Gateaux, bây giờ chúng ta có thể nói:
Tại , , vì vậy:
Bản sao mẫu hữu hạn của hàm ảnh hưởng này là:
Nói chung, tôi thấy khung này (làm việc với các hàm ảnh hưởng như các dẫn xuất Gateaux) dễ xử lý hơn.