Khi nào thích chức năng tạo mô men cho hàm đặc trưng?


9

Hãy (Ω,F,P) là một không gian xác suất, và để cho X:ΩRn là một vector ngẫu nhiên. Đặt PX=XP là phân phối của X , số đo Borel trên Rn .

  • Các chức năng đặc trưng của X là hàm
    φX(t)=E[eitX]=ΩeitXdP,
    được xác định chotRn (biến ngẫu nhiêneitX được giới hạn do đó trongL1(P) cho tất cảt ). Đây là biến đổi Fourier củaPX .
  • Các chức năng tạo ra khoảnh khắc ( MGF ) của X là hàm
    MX(t)=E[etX]=ΩetXdP,
    được xác định cho tất cảtRn mà tích phân ở trên tồn tại. Đây là biến đổi Laplace củaPX .

Chúng ta có thể thấy rằng hàm đặc trưng được xác định ở mọi nơi trên Rn , nhưng mgf có một miền phụ thuộc vào X và miền này có thể chỉ là {0} (ví dụ, điều này xảy ra đối với biến ngẫu nhiên phân phối Cauchy ).

Mặc dù vậy, các hàm đặc trưng và mgf có chung nhiều thuộc tính, ví dụ:

  1. Nếu X1,,Xn là độc lập, sau đó
    φX1++Xn(t)=φX1(t)φXn(t)
    cho tất cảt , và
    MX1++Xn(t)=MX1(t)MXn(t)
    cho tất cảt mà tồn tại của mgf.
  2. Hai vectơ ngẫu nhiên XY có cùng một phân phối nếu và chỉ nếu φX(t)=φY(t) cho tất cả các t . Tương tự mgf của kết quả này là nếu MX(t)=MY(t) cho tất cả t trong một số lân cận 0 , thì XY có cùng phân phối.
  3. Các hàm đặc trưng và mgf của các bản phân phối phổ biến thường có dạng tương tự nhau. Ví dụ, nếu XNn(μ,Σ) ( n chiều chuẩn với trung bình μ và phương sai ma trận Σ ), sau đó
    φX(t)=exp(iμt12t(Σt))
    MX(t)=exp(μt12t(Σt)).
  4. Khi một số giả định nhẹ giữ, cả hàm đặc trưng và mgf có thể được phân biệt thành các khoảnh khắc tính toán.
  5. Định lý liên tục của Lévy đưa ra một tiêu chí để xác định khi nào một chuỗi các biến ngẫu nhiên hội tụ trong phân phối đến một biến ngẫu nhiên khác bằng cách sử dụng sự hội tụ của các hàm đặc trưng tương ứng. Có một định lý tương ứng cho mgf's ( Curtiss 1942, Định lý 3 ).

Do các hàm đặc trưng và mgf thường được sử dụng cho cùng một mục đích và thực tế là hàm đặc trưng luôn tồn tại trong khi mgf không tồn tại, đối với tôi, người ta thường thích làm việc với các hàm đặc trưng hơn mgf.

Câu hỏi.

  1. Một số ví dụ trong đó mgf là hữu ích hơn các chức năng đặc trưng?
  2. Người ta có thể làm gì với một mgf mà người ta không thể làm với chức năng đặc trưng?

1
Không phải là chìa khóa cho câu hỏi này từ "giới thiệu" gần cuối? Nó có ý nghĩa sư phạm nào để giới thiệu bất cứ điều gì liên quan đến việc phân tích các số phức vào một khóa học chỉ giả sử tiếp xúc tối thiểu với (và không thoải mái với) Giải tích cơ bản và thường không phải vậy không?
whuber

1
@whuber Đó cũng là điều tôi nghĩ đến, nhưng tôi không muốn câu hỏi của mình là về sư phạm, vì vậy có lẽ tôi nên xóa đoạn cuối
Artem Mavrin

Một câu trả lời một phần có ở đây: stats.stackexchange.com/questions/304066/NH
kjetil b halvorsen

Câu trả lời:


3

Đó là một câu hỏi hay, nhưng là một câu hỏi rộng, vì vậy tôi không thể hứa rằng tôi sẽ nói mọi thứ về nó nên được nói. Câu trả lời ngắn gọn là các kỹ thuật đối thủ khác nhau không phải ở những gì họ có thể làm, mà là cách họ có thể làm điều đó gọn gàng.

Các chức năng đặc trưng đòi hỏi phải thận trọng hơn vì vai trò của số phức. Thậm chí không phải là học sinh cần biết về số phức; đó là tính toán liên quan có những cạm bẫy tinh tế. Ví dụ: tôi có thể nhận được MGF của bản phân phối bình thường chỉ bằng cách hoàn thành hình vuông thay thế thay đổi, nhưng rất nhiều nguồn bất cẩn giả vờ cách tiếp cận sử dụng các hàm đặc trưng cũng dễ dàng như vậy. Nó không phải là, bởi vì bình thường hóa nổi tiếng của tích phân Gauss nói gì về hội nhập trên ic+R với cR{0}. Ồ, chúng ta vẫn có thể đánh giá tích phân nếu chúng ta cẩn thận với các đường viền và trên thực tế có một cách tiếp cận thậm chí còn dễ dàng hơn, trong đó chúng ta thể hiện bằng cách tích hợp bởi các phần có N(0,1) phân phối của hàm đặc trưngϕ(t) thỏa mãnϕ˙=tϕ . Nhưng cách tiếp cận MGF thậm chí còn đơn giản hơn và hầu hết các bản phân phối mà sinh viên cần sớm có MGF hội tụ trên một phân đoạn dòng (ví dụ Laplace) hoặc nửa dòng (ví dụ Gamma, hình học, nhị thức âm) hoặc toàn bộR ( ví dụ Beta, nhị thức, Poisson, Bình thường). Dù bằng cách nào, đó là đủ để nghiên cứu khoảnh khắc.

Tôi không nghĩ có bất cứ điều gì bạn có thể làm chỉ với MGF, nhưng bạn sử dụng những gì dễ nhất cho nhiệm vụ trong tay. Đây là một cho bạn: cách dễ nhất để tính toán các khoảnh khắc của phân phối Poisson là gì? Tôi cho rằng nó sẽ sử dụng một kỹ thuật khác một lần nữa, hàm tạo xác suất G(t)=EtX=expλ(t1) . Khi đó biểu tượng Pochhammer rơi (X)k cho E(X)k=G(k)(1)=λk . Nói chung, thường đáng sử dụng PGF cho các bản phân phối riêng biệt, MGF cho các bản phân phối liên tục bị ràng buộc hoặc có sự phân rã siêu nhỏ trong các đuôi của PDF và chức năng đặc trưng khi bạn thực sự cần nó.

Và tùy thuộc vào câu hỏi bạn đang hỏi, thay vào đó, bạn có thể thấy thận trọng khi sử dụng hàm tạo tích lũy, được định nghĩa là logarit của MGF hoặc CF. Ví dụ, tôi sẽ để nó như một bài tập mà định nghĩa log-MGF của các tích lũy tối đa là n Exp(1) iids cho κm=(m1)!k=1nkm , cung cấp tính toán trung bình và phương sai dễ dàng hơn nhiều (tương ứng κ1κ2 ) so với khi bạn viết chúng theo các khoảnh khắc.


2
Tôi không hiểu nhận xét của bạn về "hội nhập vào " vì afaik các cf được định nghĩa là một không thể thiếu của một hàm giá trị phức trên R . Nó không phải được xem như là một tích phân. Đối với những người không thoải mái với số phức, nó có thể được xem như là một cặp tích phân thực. Không rõ làm thế nào mà mgf "đơn giản" hơn trong mọi khía cạnh. Thật vậy, cf đơn giản hơn theo nghĩa người ta không phải lo lắng về sự hội tụ. ic+R,R.
whuber

1
@whuber Ý tôi là gì . R12πexp(x22+itx)dx=it+R12πexp(y22t22)dt
JG

Tôi nghi ngờ càng nhiều. Nhưng không phải đó chỉ là một sự giả tạo về cách người ta có thể chọn để đánh giá tích phân, chứ không phải là bất kỳ tính năng vốn có nào của chính cf?
whuber

@whuber Vấn đề là rất nhiều nguồn giả vờ việc thay thế hoạt động đơn giản như trong trường hợp MGF, điều này không xảy ra.
JG

1
Bạn có phiền giải thích một chút về lý do tại sao nó không? Tôi thấy không có vấn đề gì trong trường hợp cụ thể này; và nói chung, vì tích phân ban đầu trên là hội tụ, nên người ta sẽ không mong đợi bất kỳ vấn đề nào với sự thay thế của loại này. R
whuber

3

Nếu biến ngẫu nhiên của bạn có tất cả các khoảnh khắc của nó, thì MGF tồn tại và nói chung ít nhất là hữu ích như hàm đặc trưng cho bằng chứng.

Để trả lời câu hỏi của bạn, khi MGF tồn tại, nó cung cấp cơ sở cho nhiều tính toán cực kỳ có giá trị liên quan đến X . Cách đơn giản nhất trong số đó là (đối với t0 ),

P(X>r)=P(etX>etr)MX(t)/etr.

Ở đây, rhs bây giờ có thể được giảm thiểu trên t . Kỳ lạ thay, ràng buộc này là một trong vài cách đơn giản mà chúng ta biết để có được ước tính về các sự kiện hiếm. Lĩnh vực chung của điều này là Lý thuyết độ lệch lớn , trong đó người ta phải thực hiện rất nhiều công việc để có được giới hạn tốt hơn (chặt chẽ hơn). Một ví dụ phổ biến này đang xem xét Sn=X1++Xn , do đó khi MGF của X1 tồn tại, sau đó người ta có thể hiển thị P(|SnE[X]|>nr) phân rã theo cấp số nhân trongn . Điều này thường được gọi làĐịnh lý Cramer.

Dưới đây là một số lưu ý nhỏ gọn về điều này.


1
Tất cả mọi thứ trong đoạn đầu tiên của bạn đã được đề cập trong câu hỏi ngoại trừ câu cuối cùng, mà tôi nghĩ là sai. Ví dụ: tất cả các khoảnh khắc của phân phối log-log tồn tại, nhưng mgf của nó không được xác định cho bất kỳ số thực dương nào. Phần thứ hai trong câu trả lời của bạn rất hữu ích vì nó làm nổi bật một ứng dụng của mgf dường như không có chức năng tương tự đặc trưng
Artem Mavrin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.