Sự khác biệt của hai biến ngẫu nhiên iid lognatural


23

Đặt và là 2 iidrv trong đó . Tôi muốn biết phân phối cho .X 2 log ( X 1 ) , log ( X 2 ) ~ N ( μ , σ ) X 1 - X 2X1X2đăng nhập(X1),đăng nhập(X2)~N(μ,σ)X1-X2

Điều tốt nhất tôi có thể làm là lấy chuỗi Taylor của cả hai và nhận ra rằng sự khác biệt là tổng của sự khác biệt giữa hai rv bình thường và hai rv bình phương ngoài phần còn lại của sự khác biệt giữa các điều khoản còn lại. Có cách nào đơn giản hơn để có được sự phân phối chênh lệch giữa 2 iid log-normal rv's không?


Đây là một bài báo liên quan. Bạn sẽ tìm thấy nhiều giấy tờ hơn bằng cách googling! giấy tờ.ssrn.com / sol3 / con.cfm? abauge_id = 2064829
kjetil b halvorsen

1
Tôi đã lướt qua tờ giấy đó và dường như nó không trả lời câu hỏi của tôi một cách thỏa mãn. Họ dường như quan tâm đến các xấp xỉ bằng số cho vấn đề khó hơn trong việc tìm phân phối cho tổng / chênh lệch giữa các rv lognatural tương quan . Tôi đã hy vọng rằng sẽ có một câu trả lời đơn giản hơn cho trường hợp độc lập.
sờn rách

2
Nó có thể là một câu trả lời đơn giản hơn trong trường hợp độc lập, nhưng không phải là một câu trả lời đơn giản! Trường hợp logic là một trường hợp khó được biết đến nổi tiếng --- hàm tạo thời điểm của phân phối lognatural không tồn tại --- nghĩa là, nó không hội tụ trong một khoảng mở có chứa số không. Vì vậy, bạn sẽ không tìm thấy một giải pháp dễ dàng.
kjetil b halvorsen 18/05/2015

Tôi hiểu rồi ... Vậy cách tiếp cận tôi nêu ở trên có hợp lý không? (ví dụ, nếu Ytôi= =đăng nhập(Xtôi) , X1-X2(Y1-Y2)+(Y12-Y22)/2+...Chúng ta có biết gì về các điều khoản bậc cao hơn, hoặc làm thế nào để ràng buộc chúng không?
sờn rách

1
Để minh họa cho sự khó khăn --- các MGF lognormal chỉ xác định trên (-,0] để xấp xỉ phân phối chênh lệch bằng phương pháp saddlepoint, chúng ta cần (K = gf cumulant). K(S)+K(-S) , và tổng đó chỉ được xác định ở một điểm, bằng không. Vì vậy, dường như không hoạt động. Tổng hoặc trung bình sẽ đơn giản hơn!
kjetil b halvorsen 7/10/2015

Câu trả lời:


15

Đây là một vấn đề khó khăn. Trước tiên tôi nghĩ về việc sử dụng (một số xấp xỉ) hàm tạo thời điểm của phân phối logic. Điều đó không hiệu quả, như tôi sẽ giải thích. Nhưng trước tiên một số ký hiệu:

Hãy là mật độ bình thường tiêu chuẩn và Φ tương ứng hàm phân phối tích lũy. Chúng tôi sẽ chỉ phân tích trường hợp phân phối lognatural l n N ( 0 , 1 ) , có hàm mật độ f ( x ) = 1φΦtôinN(0,1) và hàm phân phối tích lũy F(x)=Φ(lnx) Giả sửXYlà các biến ngẫu nhiên độc lập với phân phối logic bất thường ở trên. Chúng tôi quan tâm đến việc phân phốiD=X-Y, đây là phân phối đối xứng với giá trị trung bình bằng không. HãyM(t)=EđtXcó chức năng tạo ra khoảnh khắc củaX. Nó chỉ được định nghĩa chot

f(x)= =12πxe-12(lnx)2
F(x)= =Φ(lnx)
XYD= =X-YM(t)= =EetXX , vì vậy không được xác định trong một khoảng thời gian mở có chứa zero Chức năng tạo lúc cho. D M D ( t ) = E đ t ( X - Y ) = E đ t X E e - t Y = M ( t ) M ( - t ) . Vì vậy, hàm tạo mô men cho D chỉ được xác định cho t = 0t(-,0]DMD(t)= =Eet(X-Y)= =EetXEe-tY= =M(t)M(-t)Dt= =0, vì vậy không hữu ích lắm.

Điều đó có nghĩa chúng tôi sẽ cần một số cách tiếp cận trực tiếp hơn cho việc tìm kiếm ước tính cho việc phân phối các . Giả sử t 0 , tính toán P ( D t )Dt0 (và trường hợpt<0được giải bằng đối xứng, ta đượcP(Dt)=1-P(D|t|)).

P(Dt)= =P(X-Yt)= =0P(X-yt|Y= =y)f(y)dy= =0P(Xt+y)f(y)dy= =0F(t+y)f(y)dy
t<0P(Dt)= =1-P(D|t|)

Biểu thức này có thể được sử dụng để tích hợp số hoặc làm cơ sở cho mô phỏng. Đầu tiên một bài kiểm tra:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

đó là chính xác rõ ràng. Hãy để chúng tôi gói này trong một chức năng:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

cung cấp cho:

hàm phân phối tích lũy được tìm thấy bởi tích hợp số

Sau đó, chúng ta có thể tìm thấy hàm mật độ bằng cách phân biệt dưới dấu tích phân, thu được

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

mà chúng ta có thể kiểm tra:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

Và vẽ mật độ chúng ta có được:

plot(dDIFF,  from=-5,  to=5)

hàm mật độ được tìm thấy bởi tích hợp số

Tôi cũng đã cố gắng để có được một số xấp xỉ phân tích, nhưng cho đến nay đã không thành công, nó không phải là một vấn đề dễ dàng. Nhưng tích hợp số như trên, được lập trình trong R rất nhanh trên phần cứng hiện đại, vì vậy đây là một lựa chọn tốt có lẽ nên được sử dụng nhiều hơn nữa.


1

XY

Pr(XYt)= =Pr(đăng nhập(XY)đăng nhập(t))= =Pr(đăng nhập(X)-đăng nhập(Y)đăng nhập(t))~N(0,2σ2)

Tùy thuộc vào ứng dụng của bạn, điều này có thể phục vụ nhu cầu của bạn.


3
Nhưng không phải chúng ta đang nhìn vào XY thay vì log (X) - log (Y) sao?
Sextus Empiricus

Phải, tất nhiên. Đây chỉ là trong trường hợp ai đó sẽ quan tâm đến việc biết hai biến logic bất thường khác nhau như thế nào mà không nhất thiết phải là một sự khác biệt. Đó là lý do tại sao tôi cũng nói nó không trả lời câu hỏi.
Vincent Traag
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.