Làm thế nào để hồi quy lượng tử làm việc trực tuyến?


25

Tôi hy vọng sẽ có được một lời giải thích trực quan, dễ tiếp cận về hồi quy lượng tử.

Giả sử tôi có một bộ dữ liệu đơn giản về kết quả và các yếu tố dự đoán .X 1 , X 2YX1,X2

Ví dụ: nếu tôi chạy hồi quy lượng tử ở 0,25, 0,55, 0,75 và lấy lại .β0,.25,β1,.25...β2,.75

Các giá trị có được tìm thấy bằng cách chỉ cần sắp xếp các giá trị và thực hiện hồi quy tuyến tính dựa trên các ví dụ ở / gần định lượng đã cho không?yβy

Hoặc có phải tất cả các mẫu đều đóng góp vào ước tính , với trọng số giảm dần khi khoảng cách từ lượng tử tăng lên?β

Hay nó là một cái gì đó hoàn toàn khác nhau? Tôi vẫn chưa tìm thấy một lời giải thích có thể truy cập.


3
Về các phép toán, bạn có thể thấy hai câu trả lời này hữu ích: stats.stackexchange.com/questions/102906/ Lần , stats.stackexchange.com/questions/88387/ trộm
Andy

Câu trả lời:


21

Tôi đề nghị Koenker & Hallock (2001, Tạp chí Quan điểm kinh tế)sách giáo khoa cùng tên của Koenker's .

  1. Điểm bắt đầu là quan sát rằng trung vị của tập dữ liệu giảm thiểu tổng các lỗi tuyệt đối . Nghĩa là, lượng tử 50% là một giải pháp cho một vấn đề tối ưu hóa cụ thể (để tìm giá trị giảm thiểu tổng các lỗi tuyệt đối).
  2. Từ điều này, dễ dàng nhận thấy rằng bất kỳ -quantile nào cũng là giải pháp cho một vấn đề giảm thiểu cụ thể, cụ thể là giảm thiểu một tổng các lỗi tuyệt đối có trọng số không đối xứng , với các trọng số phụ thuộc vào .τττ
  3. Cuối cùng, để thực hiện bước hồi quy, chúng tôi mô hình giải pháp cho vấn đề tối thiểu hóa này là một tổ hợp tuyến tính của các biến dự báo, vì vậy bây giờ vấn đề là không tìm thấy một giá trị nào, mà là một tập hợp các tham số hồi quy.

Vì vậy, trực giác của bạn hoàn toàn chính xác: tất cả các mẫu đóng góp vào ước tính , với trọng số không đối xứng tùy thuộc vào lượng tử mà chúng tôi hướng tới.τβτ


Về điểm 1 của bạn, điều này chỉ đúng khi giả sử Y được phân phối đối xứng? Nếu Y bị lệch như {1, 1, 2, 4, 10}, trung vị 2 chắc chắn sẽ không giảm thiểu sai số tuyệt đối. Có phải hồi quy lượng tử luôn cho rằng Y được phân phối đối xứng? Cảm ơn!
Ben

1
@Ben: không, không cần phải có sự đối xứng. Điểm mấu chốt là trung vị giảm thiểu sai số tuyệt đối dự kiến . Nếu bạn có phân phối rời rạc với các giá trị 1, 2, 4, 10 và xác suất 0,4, 0,2, 0,2, 0,2, thì tóm tắt điểm 2 thực sự giảm thiểu sai số tuyệt đối dự kiến . Một mô phỏng chỉ là một vài dòng mã R:foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
S. Kolassa - Tái lập Monica

(Và vâng, đáng lẽ tôi nên nói rõ hơn trong câu trả lời của mình, thay vì thảo luận về "các khoản tiền".)
S. Kolassa - Tái lập Monica

Derp. Tôi đã nghĩ gì Điều này có ý nghĩa bây giờ, cảm ơn.
Ben

19

Ý tưởng cơ bản của hồi quy lượng tử xuất phát từ thực tế nhà phân tích quan tâm đến việc phân phối dữ liệu thay vì chỉ có ý nghĩa của dữ liệu. Hãy bắt đầu với ý nghĩa.

Hồi quy trung bình phù hợp với một dòng có dạng với giá trị trung bình của dữ liệu. Nói cách khác, . Một cách tiếp cận chung để ước tính dòng này là sử dụng phương pháp bình phương tối thiểu, .E ( Y | X = x ) = x β arg min β ( y - x β ) ( y - X β )y=XβE(Y|X=x)=xβargminβ(yxβ)(yXβ)

Mặt khác, hồi quy trung vị tìm kiếm một dòng dự kiến ​​một nửa dữ liệu nằm ở hai bên. Trong trường hợp này, chức năng đích làở đâulà chuẩn mực đầu tiên.| . |argminβ|yXβ||.|

Mở rộng ý tưởng về trung vị đến kết quả lượng tử trong hồi quy lượng tử. Ý tưởng đằng sau là để tìm một dòng -percent dữ liệu vượt quá đó.α

Ở đây bạn đã mắc một lỗi nhỏ, hồi quy Q không giống như tìm một lượng tử dữ liệu sau đó khớp một dòng với tập hợp con đó (hoặc thậm chí các đường viền khó khăn hơn).

Hồi quy Q tìm kiếm một dòng phân chia dữ liệu thành một nhóm lượng tử và phần còn lại. Hàm mục tiêu, cho biết chức năng kiểm tra của hồi quy Q là β alpha = arg min β { alpha | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | Tôi ( y < X β ) } .α

β^α=argminβ{α|yXβ|I(y>Xβ)+(1α)|yXβ|I(y<Xβ)}.

Như bạn thấy chức năng mục tiêu thông minh này không gì khác hơn là chuyển dịch lượng tử sang một vấn đề tối ưu hóa.

Hơn nữa, như bạn thấy, hồi quy Q được xác định cho một lượng tử nhất định ( ) và sau đó có thể được mở rộng để tìm tất cả các lượng tử. Nói cách khác, hồi quy Q có thể tái tạo phân phối (có điều kiện) của phản ứng.βα


Câu trả lời này là tuyệt vời.
Kim Hoa Vương
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.