Hồi quy lượng tử: Hàm mất


24

Tôi đang cố gắng để hiểu hồi quy lượng tử, nhưng một điều khiến tôi đau khổ là sự lựa chọn của hàm mất mát.

ρτ(u)=u(τ1{u<0})

Tôi biết rằng tối thiểu của kỳ vọng của ρτ(yu) bằng với τ% -quantile, nhưng lý do trực quan để bắt đầu với chức năng này là gì? Tôi không thấy mối quan hệ giữa việc giảm thiểu chức năng này và lượng tử. Ai đó có thể giải thích cho tôi?

Câu trả lời:


28

Tôi hiểu câu hỏi này khi hỏi về cái nhìn sâu sắc về cách người ta có thể đưa ra bất kỳ hàm mất mát nào tạo ra một lượng tử nhất định như một công cụ giảm thiểu tổn thất cho dù phân phối cơ bản có thể là gì. Sau đó, sẽ không thỏa đáng, chỉ cần lặp lại phân tích trong Wikipedia hoặc các nơi khác cho thấy chức năng mất đặc biệt này hoạt động.

Hãy bắt đầu với một cái gì đó quen thuộc và đơn giản.

Những gì bạn đang nói về là tìm một "vị trí" tương ứng với một phân phối hoặc tập hợp các dữ liệu F . Chẳng hạn, người ta biết rằng trung bình ˉ x giảm thiểu phần dư bình phương dự kiến; đó là một giá trịxFx¯

LF(x¯)=R(xx¯)2dF(x)

càng nhỏ càng tốt. Tôi đã sử dụng ký hiệu này để nhắc nhở chúng tôi rằng có nguồn gốc từ một mất mát , nó được xác định bởi F , nhưng quan trọng nhất là nó phụ thuộc vào số ˉ x .LFx¯

Cách thông thường để chứng minh rằng Giảm thiểu bất kỳ chức năng bắt đầu bằng cách chứng minh giá trị của hàm không giảm khi x * được thay đổi bởi một chút. Một giá trị như vậy được gọi là một điểm quan trọng của hàm.xx

Loại hàm mất nào sẽ dẫn đến phần trăm F - 1 ( α ) là một điểm tới hạn? Mất mát cho giá trị đó sẽ làΛF1(α)

LF(F1(α))=RΛ(xF1(α))dF(x)=01Λ(F1(u)F1(α))du.

For this to be a critical point, its derivative must be zero. Since we're just trying to find some solution, we won't pause to see whether the manipulations are legitimate: we'll plan to check technical details (such as whether we really can differentiate Λ, etc.) at the end. Thus

(1)0=LF(x)=LF(F1(α))=01Λ(F1(u)F1(α))du=0αΛ(F1(u)F1(α))duα1Λ(F1(u)F1(α))du.

On the left hand side, the argument of Λ is negative, whereas on the right hand side it is positive. Other than that, we have little control over the values of these integrals because F could be any distribution function. Consequently our only hope is to make Λ depend only on the sign of its argument, and otherwise it must be constant.

This implies Λ will be piecewise linear, potentially with different slopes to the left and right of zero. Clearly it should be decreasing as zero is approached--it is, after all, a loss and not a gain. Moreover, rescaling Λ by a constant will not change its properties, so we may feel free to set the left hand slope to 1. Let τ>0 be the right hand slope. Then (1) simplifies to

0=ατ(1α),

whence the unique solution is, up to a positive multiple,

Λ(x)={x, x0α1αx, x0.

Multiplying this (natural) solution by 1α, to clear the denominator, produces the loss function presented in the question.

Clearly all our manipulations are mathematically legitimate when Λ has this form.


19

The way this loss function is expressed is nice and compact but I think it's easier to understand by rewriting it as

ρτ(Xm)=(Xm)(τ1(Xm<0))={τ|Xm|ifXm0(1τ)|Xm|ifXm<0)

If you want to get an intuitive sense of why minimizing this loss function yields the τth quantile, it's helpful to consider a simple example. Let X be a uniform random variable between 0 and 1. Let's also choose a concrete value for τ, say, 0.25.

So now the question is why would this loss function be minimized at m=0.25? Obviously, there's three times as much mass in the uniform distribution to the right of m than there is to the left. And the loss function weights the values larger than this number at only a third of the weight given to values less than it. Thus, it's sort of intuitive that the scales are balanced when the τth quantile is used as the inflection point for the loss function.


1
Shouldn't it be the other way? Under-guessing will cost three times as much?
Edi Bice

Thanks for catching that. The formula is right but I initially worded it incorrectly in my explanation.
jjet
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.