Hồi quy lượng tử tiết lộ các mối quan hệ khác nhau ở các lượng tử khác nhau: làm thế nào?


8

Hồi quy lượng tử (QR) đôi khi được cho là tiết lộ các mối quan hệ khác nhau giữa các biến ở các lượng tử khác nhau của phân phối. Ví dụ: Le Cook et al. "Suy nghĩ vượt ra ngoài ý nghĩa: một hướng dẫn thực tế để sử dụng các phương pháp hồi quy lượng tử cho nghiên cứu dịch vụ y tế" ngụ ý rằng QR cho phép mối quan hệ giữa kết quả quan tâm và các biến giải thích không khác nhau giữa các giá trị khác nhau của các biến.

Tuy nhiên, theo như tôi biết, trong một tiêu chuẩn tuyến tính mô hình hồi quy với ε là iid và không phụ thuộc vào X , các ước lượng QR cho dốc β

y=β0+βX+ε
εXβlà phù hợp với độ dốc dân số (là duy nhất và không có cách nào khác nhau giữa các lượng tử). Đó là, đối tượng được ước tính luôn giống nhau, bất kể lượng tử. Phải thừa nhận rằng, đây không phải là trường hợp của việc chặn, vì công cụ ước tính chặn QR nhằm mục đích ước tính một lượng tử cụ thể của phân phối lỗi. Được kết hợp với nhau, tôi không thấy các mối quan hệ khác nhau giữa các biến được cho là được tiết lộ ở các lượng tử khác nhau thông qua QR. Tôi đoán đây là một thuộc tính của mô hình hồi quy tuyến tính tiêu chuẩn chứ không phải là một sai lầm trong cách hiểu của tôi, nhưng tôi không chắc chắn.

Tôi cho rằng tình hình là khác nhau khi một số giả định của mô hình tuyến tính tiêu chuẩn bị vi phạm, ví dụ như dưới một số dạng không đồng nhất có điều kiện. Sau đó, có lẽ các công cụ ước tính độ dốc QR hội tụ đến một thứ khác ngoài độ dốc thực sự của mô hình tuyến tính và bằng cách nào đó tiết lộ các mối quan hệ khác nhau ở các lượng tử khác nhau.

Tôi đang làm gì sai? Làm thế nào tôi nên hiểu / giải thích chính xác tuyên bố rằng hồi quy lượng tử cho thấy mối quan hệ khác nhau giữa các biến ở các lượng tử khác nhau?


1
Có rất nhiều cách để nghĩ về QR. Một là nó là một loại hồi quy hạt nhân trong đó các hạt nhân là các lượng tử. Theo cách này, nó là cách tiếp cận phi tham số và mạnh mẽ trong đó các giải pháp tuyến tính không thể được giả định. Hyndman, et al, đã đề xuất tăng hồi quy lượng tử thích ứng như là một khuôn khổ toàn cầu cho mô hình hóa dựa trên QR. Bản sao được ủng hộ tại đây ... robjhyndman.com/ con / sig
Mike Hunter

1
@DJohnson, cảm ơn. Tôi đoán rằng tôi bị ảnh hưởng bởi bài báo gốc Koenker và Bassett (1978) trong đó động lực chỉ là tìm một công cụ ước tính độ dốc mạnh trong mô hình tuyến tính tiêu chuẩn thay vì gợi ra các mối quan hệ khác nhau ở các lượng tử khác nhau.
Richard Hardy

Không có câu hỏi nào ngoài những bài báo như Koenker và Bassett tác động đến việc các nhà phân tích trong tương lai đặt ra một câu hỏi. Một bài viết hay khác về QR là Le Cook và Manning's 2013, * Thinking Beyond the mean: một hướng dẫn thực tế để sử dụng các phương pháp hồi quy lượng tử "... sao chép vô duyên ở đây ... dash.harvard.edu/bitstream/handle/1/12406692/ ... FWIW ... nhưng tập trung của họ là chăm sóc sức khỏe ...
Mike Hunter

Câu trả lời:


8

xxx. Trong QR bạn sẽ thấy ngay điều này từ các ước tính độ dốc rất khác nhau. Vì OLS chỉ quan tâm đến giá trị trung bình (tức là lượng tử trung bình), bạn không thể mô hình hóa từng lượng tử riêng biệt. Ở đó, bạn hoàn toàn dựa vào giả định về hình dạng cố định của phân phối có điều kiện khi đưa ra tuyên bố về lượng tử của nó.

EDIT: Nhúng bình luận và minh họa

Nếu bạn sẵn sàng đưa ra các giả định mạnh mẽ đó, sẽ không có nhiều điểm khi chạy QR vì bạn luôn có thể tính toán các lượng tử có điều kiện thông qua trung bình có điều kiện và phương sai cố định. Độ dốc "thực" của tất cả các lượng tử sẽ bằng độ dốc thực của giá trị trung bình. Trong một mẫu cụ thể, tất nhiên sẽ có một số biến thể ngẫu nhiên. Hoặc thậm chí bạn có thể phát hiện ra rằng các giả định nghiêm ngặt của mình là sai ...

y= =x+xε,ε~N(0,1) iid,
yxnhập mô tả hình ảnh ở đây
  • Các đường hồi quy của giá trị trung bình và trung bình về cơ bản là giống nhau do phân bố điều kiện đối xứng. Độ dốc của chúng là 1.
  • Đường hồi quy của lượng tử 80% dốc hơn nhiều (độ dốc 1.9), trong khi đường hồi quy của lượng tử 20% gần như không đổi (độ dốc 0,3). Điều này rất phù hợp với phương sai cực kỳ bất bình đẳng.
  • x

Mã để tạo hình ảnh:

library(quantreg)

set.seed(3249)
n <- 1000
x <- seq(0, 1, length.out = n)
y <- rnorm(n, mean = x, sd = x)

plot(y~x)

(fit_lm <- lm(y~x)) # intercept: 0.02445, slope: 1.04858 
abline(fit_lm, lwd = 3)

# quantile cuts
taus <- c(0.2, 0.5, 0.8)

(fit_rq <- rq(y~x, tau = taus))
#               tau= 0.2      tau= 0.5    tau= 0.8
# (Intercept) 0.00108228 -0.0005110046 0.001089583
# x           0.29960652  1.0954521888 1.918622442

lapply(seq_along(taus), function(i) abline(coef(fit_rq)[, i], lwd = 2, lty = 2, col = "red"))

2
x

2
Chính xác. Nếu bạn sẵn sàng đưa ra các giả định mạnh mẽ đó, sẽ không có nhiều điểm khi chạy QR vì bạn luôn có thể tính toán các lượng tử có điều kiện thông qua trung bình có điều kiện và phương sai cố định. Độ dốc "thực" của tất cả các lượng tử sẽ bằng độ dốc thực của giá trị trung bình. Trong mẫu, sẽ có một số biến thể ngẫu nhiên. Hoặc thậm chí bạn có thể phát hiện ra rằng các giả định nghiêm ngặt của mình đã sai ... ;-)
Michael M

Điều đó có ý nghĩa. Trong mẫu, tôi nghĩ rằng ước tính độ dốc QR cho các lượng tử khác nhau có thể sẽ phần nào được trải ra phù hợp với các lượng tử. Điều này là do hàm mất mát được giảm thiểu sẽ kéo công cụ ước tính không đối xứng sang một bên (hướng và độ lớn của lực kéo tùy thuộc vào lượng tử), mặc dù hiệu ứng này sẽ không bao giờ nhỏ hơn.
Richard Hardy

1
Đó là một câu trả lời tốt và cảm ơn bạn vì điều đó, nhưng tôi tự hỏi liệu bạn có thể minh họa bằng một ví dụ đơn giản về cách QR tiết lộ các mối quan hệ khác nhau ở các lượng tử khác nhau khi một số giả định tiêu chuẩn (ví dụ như homoskedasticity) không giữ được.
Richard Hardy

Vì vậy, quá trình tạo dữ liệu là một mô hình tuyến tính nhưng với độ lệch chuẩn (phương sai?) Của tỷ lệ thuận với giá trị trung bình của x , phải không? Tức là y = x + x ε trong đó ε i . i . N ( 0xxy= =x+xεε~Tôi.Tôi.N(0,1)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.