Biện minh cho việc sử dụng trọng số hình học trong hồi quy tuyến tính


8

Trong ứng dụng thực tế, tôi đã chứng kiến ​​thường xuyên thực hành sau đây. Người ta quan sát một cặp (xt,yt)tăng ca. Theo giả định rằng chúng có liên quan tuyến tính, chúng tôi hồi quy cái này với cái kia bằng trọng số hình học thay vì trọng số đồng nhất, nghĩa là, OLS giảm thiểu

Σt= =0kt(yT-t-mộtxT-t-b)2
cho một số k(0,1). Điều này rất trực quan: chúng ta cân nhắc ít quan sát hơn trong quá khứ. So với sơ đồ trọng số "boxcar", nó cũng có lợi thế là tạo ra các ước tính đang thay đổi suôn sẻ theo thời gian, bởi vì các quan sát không đột ngột rơi ra khỏi cửa sổ quan sát. Tuy nhiên, tôi tự hỏi nếu có một mô hình xác suất làm cơ sở cho mối quan hệ giữaxtyt điều đó biện minh cho sự lựa chọn này.

Mới hôm nọ, một người nào đó ở đâu đó trên một trong những trang StackExchange có liên quan đã bình luận về sơ đồ này là "bộ lọc Kalman của người nghèo". Nếu tôi quản lý để khai quật liên kết, tôi sẽ thêm nó ở đây.
Dirk Eddelbuettel

Cảm ơn. Tôi muốn xem làm thế nào điều này có thể được trang bị lại như một bộ lọc Kalman.
vui vẻ

1
Tôi nghi ngờ có một dẫn xuất chính thức, do đó các trích dẫn xung quanh phiên bản thông số thích nghi của người nghèo.
Dirk Eddelbuettel

Câu trả lời:


6

"Liên quan tuyến tính" thường có nghĩa là

yt=axt+b+εt

cho hằng số a, b và iid lỗi ngẫu nhiên εt, t=0,1,,T. Một lý do khiến người ta ước tính OLS theo cấp số nhân là sự nghi ngờ rằngabbản thân họ cũng có thể (chậm) thay đổi theo thời gian. Vì vậy, chúng tôi thực sự nghĩ rằng mô hình chính xác là

yt=α(t)xt+β(t)+εt

cho các chức năng chưa biết α(t)β(t) thay đổi chậm (nếu có) theo thời gian và chúng tôi quan tâm đến việc ước tính giá trị hiện tại của chúng, a=αTb=βT. Giả sử các hàm này hoạt động trơn tru, vì vậy chúng ta có thể áp dụng Định lý Taylor. Điều này khẳng định rằng

α(t)=α(T)+α(tα,t)(tT)

cho một số tα,t,0tα,t<Tvà tương tự cho β(t). Chúng tôi nghĩ vềab là những giá trị gần đây nhất, αTβT, tương ứng. Sử dụng để thể hiện lại phần dư:

yt(axt+b)=α(tα,t)(tT)xt+β(tβ,t)(tT)+εt.

Bây giờ rất nhiều vẫy tay cần phải xảy ra. Chúng tôi sẽ xem xét toàn bộ phía bên tay phải là ngẫu nhiên. Phương sai của nó làεt thêm xt2(tT)2 nhân với phương sai của α(tα,t) thêm (tT)2 nhân với phương sai của β(tβ,t). Hai phương sai đó hoàn toàn không được biết, nhưng ( abracadabra ) chúng ta hãy nghĩ về chúng là kết quả của một quá trình (ngẫu nhiên) nào đó trong đó có thể có lỗi "không ngẫu nhiên, nhưng vẫn chưa biết" hoặc "biến thể" được tích lũy từ một lần đến cai khac. Điều này sẽ gợi ý một sự thay đổi theo cấp số nhân trong những phương sai đó theo thời gian. Bây giờ chỉ cần đơn giản hóa biểu thức rõ ràng (nhưng về cơ bản là vô dụng) cho phía bên tay phải và tiếp thu các thuật ngữ bậc hai(tT)2 theo cấp số nhân (vì dù sao chúng ta cũng vẫy tay rất cuồng nhiệt), để có được

yt(axt+b)=δt

với phương sai của δt tương đương với exp(κ(tT)) cho một số hằng κ. Bỏ qua các mối tương quan thời gian có thể giữa cácδt và giả sử họ có các bản phân phối bình thường mang lại khả năng ghi nhật ký cho dữ liệu tỷ lệ với

t=0Tkt(yTtaxTtb)2

(cộng với một hằng số không liên quan chỉ phụ thuộc vào k) với k=expκ. Do đó, thủ tục OLS có trọng số theo cấp số nhân tối đa hóa khả năng, giả sử chúng ta biết giá trị củak (giống như một thủ tục khả năng hồ sơ).

Mặc dù toàn bộ đạo hàm này rõ ràng là huyền ảo, nhưng nó cho thấy cách thức, và ở mức độ nào, trọng số theo cấp số nhân cố gắng đối phó với những thay đổi có thể có trong các tham số tuyến tính theo thời gian. Nó liên quan đến tham sốk đến tốc độ thay đổi tạm thời của các tham số đó.


Tôi đồng ý về phần vẫy tay ... Tôi ổn với việc đơn giản hóa các giả định về hình thức thay đổi thời gian của các tham số hồi quy, miễn là chúng được nêu rõ ràng. Tất nhiên cảm thấy tự do để tham khảo tài liệu hiện có.
vui vẻ

@whuber - Tôi muốn nói rằng hồi quy theo cấp số nhân là một xấp xỉ rất thô đối với mô hình cụ thể mà bạn đã mô tả . Nhưng nó cũng có thể là một giải pháp chính xác cho một mô hình khác. Đối với mô hình mà bạn mô tả, sẽ tốt hơn nhiều nếu bao gồm thành phần không đồng nhất do sự thay đổi trongα(t)(hoặc giả sử rằng nó không có biến thể và bạn đang xử lý chặn ngẫu nhiên). Bạn đang làm cho nó có vẻ như mặc dù trọng số hình học luôn luôn là tối ưu, điều đó không phải là. Nó phụ thuộc vào thông tin trước của bạn.
xác suất

@prob Tôi đồng ý, nhưng tôi chưa thể tìm thấy một mô hình nào biện minh chính xác cho phương pháp này, vì vậy tôi phải giải quyết vì đã chỉ ra một số điều mà một mô hình có thể đòi hỏi. Tôi nhận thấy câu trả lời của bạn không tạo ra bất kỳ tiến triển nào theo hướng này ;-).
whuber

@whuber - và nơi tôi thực hiện một phép tính gần đúng trong phương trình của tôi để nó không chính xác?
xác suất

@probability Bạn không cung cấp lời biện minh: Bạn chỉ cần thông báo kết quả tôi đã đăng. Nói cách khác, bạn quan sát thấy rằng khi OLS giảm thiểu một biểu thức như vậy, nó thực sự thực hiện bình phương tối thiểu có trọng số. OK, nhưng đó không phải là hoàn toàn rõ ràng? Điều gì biện minh cho sự lựa chọn trọng lượng này? Họ đến từ đâu?
whuber

1

Tôi nghĩ rằng bạn thực sự có nghĩa là kt như trọng lượng của bạn, hoặc đó k>1. Nếu0<k<1 và chúng tôi lấy k-t như trọng lượng sau đó k-= =. Vì vậy, điều này thực sự có trọng lượng quan sát hiện tại ít nhất. Ví dụ: nếu chúng ta lấyk= =0,5 sau đó k0= =1,k-1= =2,k-2= =4,Giáo dục,k-20106, và như thế.

Đây chỉ là một điều gì đó mà bạn biết về cách phương sai thay đổi theo từng quan sát (nó sẽ lớn hơn khi bạn di chuyển ngược thời gian theo thời gian T):

(yT-t|xT-t,một,b,k,S)~Normmộttôi(mộtxT-t+b,S2k-t)

Biểu thị Y{yT,yT-1,Giáo dục,y1}X{xT,xT-1,Giáo dục,x1} chúng tôi có khả năng đăng nhập chung của:

đăng nhập[p(Y|X,một,b,k,S)]= =-12(Tđăng nhập(2πS2k-t)+Σt= =0T-1(yT-t-mộtxT-t-b)2S2k-t)

Vì vậy, để có được ước tính khả năng tối đa của mộtb bạn có chức năng mục tiêu sau:

Σt= =0T-1kt(yT-t-mộtxT-t-b)2

Đó là một trong những bạn tìm kiếm

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.