Tổng các biến ngẫu nhiên lognatural độc lập xuất hiện lognatural?


11

Tôi đang cố gắng để hiểu tại sao tổng của hai (hoặc nhiều hơn) các biến ngẫu nhiên logic bất thường tiếp cận phân phối logic bất thường khi bạn tăng số lượng quan sát. Tôi đã xem trực tuyến và không tìm thấy bất kỳ kết quả nào liên quan đến việc này.

Rõ ràng nếu và là các biến lognatural độc lập, thì theo các thuộc tính của số mũ và biến ngẫu nhiên gaussian, cũng là lognatural. Tuy nhiên, không có lý do gì để cho rằng cũng là logic.Y X × Y X + YXYX×YX+Y

TUY NHIÊN

Nếu bạn tạo hai biến ngẫu nhiên lognatural và độc lập và để và lặp lại quá trình này nhiều lần, phân phối của xuất hiện logic bất thường. Nó thậm chí còn xuất hiện để tiến gần hơn đến phân phối hợp lý khi bạn tăng số lượng quan sát.Y Z = X + Y ZXYZ=X+YZ

Ví dụ: Sau khi tạo 1 triệu cặp, phân phối nhật ký tự nhiên của Z được đưa ra trong biểu đồ bên dưới. Điều này rất rõ ràng giống như một phân phối bình thường, cho thấy thực sự là logic.Z

nhập mô tả hình ảnh ở đây

Có ai có bất kỳ cái nhìn sâu sắc hoặc tài liệu tham khảo cho các văn bản có thể được sử dụng để hiểu điều này?


Bạn có giả sử phương sai bằng nhau cho và không? Nếu bạn mô phỏng , thì nhật ký của tổng không còn trông rất bình thường nữa. YXYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Stephan Kolassa

Tôi đã giả sử phương sai bằng nhau - Tôi sẽ thử phương sai khác với phương sai không bằng nhau và xem cuối cùng tôi sẽ làm gì.
Patty

Với phương sai của 2 và 3, tôi có một cái gì đó trông vẫn hơi bình thường, albiet với những gì trông giống như một xiên nhỏ xíu.
Patty

1
Nhìn qua các câu hỏi trước có thể hữu ích. Đâyđây là những giấy tờ hữu ích. Nhìn tốt đấy!
Stephan Kolassa

Câu trả lời:


20

Tính logic gần đúng này của các khoản tiền của lognormals là một quy tắc nổi tiếng; nó được đề cập trong nhiều bài báo - và trong một số bài đăng trên trang web.

Một xấp xỉ logic bất thường cho một tổng số lognormals bằng cách khớp hai khoảnh khắc đầu tiên đôi khi được gọi là xấp xỉ Fenton-Wilkinson.

Bạn có thể thấy tài liệu này của Dufresne hữu ích (có sẵn tại đây hoặc tại đây ).

Trước đây, đôi khi tôi cũng chỉ cho mọi người thấy bài báo của Mitchell

Mitchell, RL (1968),
"Sự tồn tại của phân phối log-normal."
J. Hiệp hội quang học của Mỹ . 58: 1267-1272.

Nhưng điều đó hiện được đề cập trong các tài liệu tham khảo của Dufresne.

Nhưng mặc dù nó chứa trong một tập hợp khá rộng các trường hợp không quá sai, nhưng nó không giữ chung, thậm chí đối với các lognormal iid, thậm chí không phải vì khá lớn.n

Đây là biểu đồ gồm 1000 giá trị mô phỏng, mỗi bản ghi của tổng số năm mươi nghìn lognormals:

biểu đồ tổng của năm mươi ngàn lognormals

Như bạn thấy ... nhật ký khá sai lệch, do đó, tổng số không gần với lognatural.

Thật vậy, ví dụ này cũng sẽ được coi là một ví dụ hữu ích cho mọi người suy nghĩ (vì định lý giới hạn trung tâm) rằng một số trong hàng trăm hoặc hàng ngàn sẽ đưa ra rất gần với mức trung bình bình thường; cái này sai lệch đến mức nhật ký của nó bị lệch đáng kể, nhưng định lý giới hạn trung tâm vẫn được áp dụng ở đây; một của nhiều triệu * sẽ là cần thiết trước khi nó bắt đầu nhìn ở bất cứ đâu gần đối xứng.nnn

* Tôi đã không cố gắng tìm ra có bao nhiêu nhưng, vì cách mà sự sai lệch của các khoản tiền (tương đương, trung bình) hành xử, một vài triệu rõ ràng sẽ không đủ


Do có nhiều chi tiết được yêu cầu trong các nhận xét, bạn có thể nhận được kết quả tương tự với ví dụ với mã sau, tạo ra 1000 lần lặp lại tổng số 50.000 biến ngẫu nhiên lognatural với tham số tỷ lệ và tham số hình dạng :μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(Tôi đã thử Nhật ký của nó vẫn bị lệch rất nhiều)n=106


Bạn có thể vui lòng thêm các tham số (hoặc đoạn mã) được sử dụng để tạo biểu đồ trong hình không?
altroware

1
μμ=0σμ=0σ44
Glen_b -Reinstate Monica

1
res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)26.5

2

Có lẽ đã quá muộn, nhưng tôi đã tìm thấy bài báo sau đây về các bản phân phối hợp lý , bao gồm chủ đề này. Nó không phải là bất thường, nhưng một cái gì đó khá khác biệt và khó làm việc.


1

Bài báo được đề xuất bởi Dufresne năm 2009 và bài này từ năm 2004 cùng với bài viết hữu ích này bao gồm lịch sử về các xấp xỉ của tổng phân phối log-log thông thường và cho kết quả toán học tổng hợp.

μσ

Có thể [bài báo này] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) cung cấp cho bạn trong một trường hợp cụ thể một loại định lý giới hạn trung tâm cho tổng các quy tắc log nhưng vẫn còn một thiếu tính tổng quát. Dù sao, ví dụ được đưa ra bởi Glen_b nó không thực sự phù hợp, bởi vì đó là trường hợp bạn có thể dễ dàng áp dụng định lý giới hạn trung tâm cổ điển, và tất nhiên trong trường hợp đó, tổng số log-normal là Gaussian.

n


1
Bạn nói rằng trong ví dụ của tôi "bạn có thể dễ dàng áp dụng định lý giới hạn trung tâm cổ điển" nhưng nếu bạn hiểu biểu đồ đang hiển thị gì, rõ ràng bạn không thể sử dụng CLT để lập luận rằng một xấp xỉ bình thường áp dụng ở mức n = 50000 cho trường hợp này; tổng là rất đúng lệchnhật ký của nó vẫn còn nhiều sai lệch đúng. Điểm chính của ví dụ là nó thậm chí quá lệch để gần đúng bởi một logic bất thường (hoặc biểu đồ đó sẽ trông rất gần với đối xứng). Một xấp xỉ ít sai lệch (như bình thường) sẽ * tệ hơn * /
Glen_b -Reinstate Monica

Tôi đồng ý, nhưng có lẽ trong ví dụ của bạn, không đạt được độ hội tụ số của mẫu (1000 thử nghiệm là quá ít) hoặc không đạt được độ hội tụ thống kê, (50 000 bổ sung là quá ít), nhưng trong giới hạn đến vô hạn thì phân phối phải là Gaussian, vì chúng ta đang ở trong điều kiện CLT, phải không?
Mimì

1000 mẫu là quá đủ để phân biệt hình dạng phân phối của tổng - số lượng mẫu chúng tôi lấy không làm thay đổi hình dạng, chỉ là cách chúng tôi nhìn thấy "rõ ràng". Sự sai lệch rõ ràng đó sẽ không biến mất nếu chúng ta lấy một mẫu lớn hơn, nó sẽ trở nên mượt mà hơn. Có, 50.000 là quá ít để số tiền trông bình thường - thật sai lầm khi nhật ký vẫn trông rất sai lệch. Nó cũng có thể đòi hỏi nhiều triệu trước khi nó trông có vẻ bình thường. Có, CLT chắc chắn áp dụng; đó là iid và phương sai là hữu hạn, vì vậy các phương tiện được tiêu chuẩn hóa cuối cùng phải tiếp cận tính quy phạm.
Glen_b -Reinstate Monica

1

Luật logic bất thường được trình bày rộng rãi về các hiện tượng vật lý, ví dụ, các loại phân phối biến này là cần thiết để nghiên cứu bất kỳ hành vi nhân rộng nào của một hệ thống. Tôi biết bài viết này (rất dài và rất mạnh, sự khởi đầu có thể được thực hiện nếu bạn không phải là người theo chủ nghĩa duy nhất!), "Hiệu ứng phân phối rộng trong tổng số các biến ngẫu nhiên lognatural" được xuất bản năm 2003, (Tạp chí vật lý châu Âu B-Condensed Matter and Complex Hệ thống 32, 513) và có sẵn https://arxiv.org/pdf/physics/0211065.pdf .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.