Trực giác đằng sau tỷ lệ nguy hiểm


16

Tôi bối rối về phương trình đóng vai trò là định nghĩa về tỷ lệ nguy hiểm. Tôi có ý tưởng về tỷ lệ nguy hiểm là gì, nhưng tôi không thấy phương trình biểu thị trực giác đó như thế nào.

Nếu x là biến ngẫu nhiên đại diện cho điểm chết của ai đó trong khoảng thời gian [0,T] . Sau đó, tỷ lệ nguy hiểm là:

h(x)=f(x)1F(x)

Trong trường hợp F(x) đại diện cho xác suất tử vong cho đến thời điểm x[0,T] ,
1F(x) đại diện cho khả năng đã tồn tại cho đến thời điểm x[0,T] ,
f(x) là xác suất tử vong tại điểm x .

Làm thế nào để chia với tỷ lệ sống sót giải thích trực giác của xác suất tử vong tức thời ở bên cạnh Δ t ? Không phải nó chỉ là f ( x ) , làm cho việc tính toán tỷ lệ nguy hiểm không đáng kể?f(x)Δtf(x)

Câu trả lời:


11

Gọi là thời gian chết (hoặc thời gian thất bại nếu bạn thích mô tả ít bệnh hoạn hơn). Giả sử rằng X là một liên tục biến ngẫu nhiên có mật độ chức năng f ( t ) là khác không chỉ trên ( 0 , ) . Bây giờ, thông báo rằng nó phải là trường hợp đó f ( t ) phân rã đi đến 0 như t vì nếu f ( t ) không sâu xa như đã nêu, sau đó - fXXf(t)(0,)f(t)0tf(t) không thể giữ. Như vậy, khái niệm của bạn màf(T)là xác suất tử vong lúcT (trên thực tế, nó làf(T)Δtđó là (ước tính) xác suất tử vong ởngắnkhoảng cách(T,T+Δt] của chiều dàiΔt) dẫn đến kết luận không thể tin được và không thể tin được nhưf(t)dt=1f(T)Tf(T)Δt(T,T+Δt]Δt

Bạn có nhiều khả năng chết trong vòng một tháng tới khi bạn ba mươi tuổi so với khi bạn chín mươi tám tuổi.

Bất cứ khi nào sao cho f ( 30 ) > f ( 98 ) .f(t)f(30)>f(98)

Lý do tại sao (hoặc f ( T ) Δ t ) là "sai" xác suất để nhìn vào là giá trị của f ( T ) là mối quan tâm duy nhất để những người đang sống ở tuổi T (và vẫn tinh thần đủ tỉnh táo để đọc stats.SE một cách thường xuyên!) Điều gì phải được xem xét là xác suất của một T Năm mới cũ chết trong tháng tới, có nghĩa là,f(T)f(T)Δtf(T)TT

P{(X(T,T+Δt]XT}=P{(X(T,T+Δt])(XT)}P{XT} definition of conditional probability=P{X(T,T+Δt]}P{XT}=f(T)Δt1F(T)because X is a continuous rv

Chọn là một hai tuần, một tuần, một ngày, một giờ, một phút, vv chúng tôi đi đến kết luận rằng các (tức thời) tỷ lệ nguy hiểm cho một T Năm mới là cũΔtT

h(T)=f(T)1F(T)

theo nghĩa là các xấp xỉ xác suất tử vong ở các femto giây tiếp theo của một T Năm mới cũ là f ( T ) Δ t(Δt)Tf(T)Δt1F(T).

Lưu ý rằng trái ngược với mật độ tích hợp để 1 , tích phân 0 h ( t )f(t)1 phải phân kỳ. Điều này là do CDFF(t)có liên quan đến tỷ lệ nguy hiểm thông qua0h(t)dt F(t)

và kể từ lim t F(t)=1, nó phải được rằng lim t t 0 h(τ)

F(t)=1exp(0th(τ)dτ)
limtF(t)=1 hay tuyên bố chính thức hơn, không thể thiếu của các tỷ lệ nguy hiểmphảiphân ra: không cókhả năngphân kỳ như một chỉnh sửa trước đó tuyên bố.
limt0th(τ)dτ=,

Tỷ lệ nguy hiểm điển hình là tăng chức năng của thời gian, nhưng tỷ lệ nguy hiểm không đổi (tuổi thọ theo cấp số nhân) là có thể. Cả hai loại tỷ lệ nguy hiểm này rõ ràng có tích phân khác nhau. Một kịch bản ít phổ biến hơn (đối với những người tin rằng mọi thứ sẽ cải thiện theo tuổi tác, giống như rượu vang hảo hạng) là tỷ lệ nguy hiểm giảm dần theo thời gian nhưng đủ chậm để phân tách.


"Hãy để X biểu thị thời gian chết (hoặc thời gian thất bại nếu bạn thích mô tả ít bệnh hoạn hơn". Thời gian cho đến khi hồi phục thậm chí ít bệnh hoạn hơn.
ryu576

10

Hãy tưởng tượng rằng bạn quan tâm đến tỷ lệ kết hôn (đầu tiên) đối với đàn ông. Để xem xét tỷ lệ kết hôn ở tuổi 20, giả sử, bạn sẽ chọn một mẫu người chưa kết hôn ở tuổi đó và xem họ có kết hôn trong năm tới không (trước khi họ 21 tuổi).

P(marrybefore21|notmarriedat20)
as the proportion of individuals who got married from your sample of single 20 year olds, i.e.
N(marriedbefore21andnotmarriedat20)N(notmarriedat20)

So basically this is just using the definition of conditional probability,

P(X|Y)=P(X,Y)P(Y).
Now imagine we make the age unit smaller and smaller, up to days for example. I.e. what is the incidence of marriage at age of 7300 days? Then you would do the same, but survey all individuals of 7300 days and look who gets married before the end of the day. If T is a random variable age at marriage, then we could write
P(T7301)|T7300)=P(T[7300,7301))P(T7300)
by the same logic as before.

The hazard would then be the instantaneous probability of marriage at age t, for a non-married individual. We can write this as

h(t)dt=P(T[t,t+dt)|Tt)=P(T[t,t+dt))P(Tt)

5

f(x) is not the probability of death, but the probability density; the expected number of times you die within the next unit of time if the probability density remained constant during that unit of time.

Notice there is a problem: your probability of dying when you already died before is rather problematic. So it makes more sense to compute the probability of dying conditional on having survived thus far. 1F(t) it the probability of having survived until t, so dividing the probabilty density by that probability, will get us the expected number of times we will die within the next unit of time conditional on not having died before. That is the hazard rate.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.