Làm thế nào bạn sẽ giải thích chức năng tạo thời điểm (MGF) theo thuật ngữ của giáo dân?


15

Chức năng tạo khoảnh khắc (MGF) là gì?

Bạn có thể giải thích nó theo thuật ngữ của giáo dân và cùng với một ví dụ đơn giản và dễ dàng không?

Xin vui lòng, hạn chế sử dụng các ký hiệu toán học chính thức càng xa càng tốt.


1
Bạn muốn một ví dụ đơn giản, dễ dàng ... nhưng không có ký hiệu toán học? Tôi không chắc chắn một việc như vậy sẽ rất dễ thực hiện - ít nhất là không có nguy cơ gây ấn tượng sai lệch về những gì bạn đang giải quyết. Tôi cho rằng người ta có thể đưa ra mgf của một biến ngẫu nhiên suy biến luôn là mà không cần nhiều ký hiệu toán học, nhưng sẽ không sáng tỏ nếu bạn thực sự muốn hiểu về mgfs. 0
Glen_b -Reinstate Monica

1
Tôi không chắc có cách hiểu trực quan nào không, bạn có thể nghĩ về nó như một cách "mã hóa" phân phối (ít nhất là khi nó tồn tại, ý tưởng này hoạt động tốt hơn một chút với các chức năng đặc trưng).
DSaxton

1
Hàm tạo thời điểm - khi nó tồn tại - là một cách mã hóa tất cả các khoảnh khắc không nguyên âm của một biến ngẫu nhiên thành một hàm và từ đó chúng có thể được trích xuất lại; mgfs có thể được sử dụng để thực hiện các tính toán cụ thể đôi khi không dễ thực hiện theo những cách khác. Tôi không mong đợi sự giúp đỡ đó nhiều.
Glen_b -Reinstate Monica

1
Tôi chắc rằng bạn đã thấy Joe Blitztein trả lời cho câu hỏi giống hệt nhau trên Quora
Antoni Parellada

Câu trả lời:


18

Chúng ta hãy giả sử rằng một trực giác không có phương trình là không thể, và vẫn khăng khăng làm sôi môn toán đến mức cần thiết để có ý tưởng về những gì đang diễn ra: chúng ta đang cố gắng để có được những khoảnh khắc thống kê , sau khi tham chiếu bắt buộc vào vật lý , chúng tôi định nghĩa là giá trị kỳ vọng của công suất của một biến ngẫu nhiên. Đối với một biến ngẫu nhiên liên tục, khoảnh khắc thứ k thô là bởi LOTUS :

(1)E[Xk]=Xkpdfdx

Hàm tạo thời điểm ,

MX(t):=E[etX],
là mộtcách để đi bộ xung quanh tích phân này (Eq.1)bằng cách, thay vào đó, thực hiện:

(2)E[etX]=etXpdfdx

Tại sao? Bởi vì nó dễ dàng hơn và có một tài sản tuyệt vời của MGF có thể được nhìn thấy bằng cách mở rộng loạt Maclaurin của etX

etX=1+X1!t+X22!t2+X33!t3+

Lấy kỳ vọng của cả hai bên của loạt quyền lực này:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

những khoảnh khắc xuất hiện "đậu" trên "dây phơi" đa thức này, sẵn sàng để được loại bỏ bằng cách phân biệt đơn giản k lần và đánh giá ở mức 0 khi chúng ta trải qua quá trình tích hợp dễ dàng hơn (trong eq. (2)) chỉ một lần cho tất cả các khoảnh khắc! Thực tế là nó là một sự tích hợp dễ dàng hơn là rõ ràng nhất khi pdf là một số mũ.

Để phục hồi khoảnh khắc thứ k :

MX(k)(0)=dkdtkMX(t)|t=0

Thực tế là cuối cùng cần phải phân biệt làm cho nó không phải là một bữa ăn trưa miễn phí - cuối cùng nó là một biến đổi Laplace hai mặt của pdf với một dấu hiệu thay đổi theo số mũ:

L{pdf(x)}(s)=esxpdf(x)dx

sao cho

(4)MX(t)=L{pdf(x)}(s).

Điều này, về hiệu quả, mang lại cho chúng ta một con đường vật lý cho trực giác. Biến đổi Laplace đang hoạt động trên pdf và phân tách nó thành các khoảnh khắc. Điểm tương đồng với biến đổi Fourier là không thể giải thích được : FT ánh xạ một chức năng thành một chức năng mới trên dòng thực và Laplace ánh xạ một chức năng sang một chức năng mới trên mặt phẳng phức. Biến đổi Fourier biểu thị một hàm hoặc tín hiệu dưới dạng một chuỗi tần số, trong khi biến đổi Laplace giải quyết một hàm thành các khoảnh khắc của nó . Trong thực tế, một cách khác để có được các khoảnh khắc là thông qua một biến đổi Fourier ( chức năng đặc trưng ). Thuật ngữ hàm mũ trong biến đổi Laplace nói chung có dạng est vớis=σ+iω , tương ứng vớihàm mũ thực và sinusoidals tưởng tượng, và năng suất lô nhưnày:


[ Từ Hướng dẫn của nhà khoa học và kỹ sư đến xử lý tín hiệu của Steven W. Smith ]


Do đó MX(t) chức năng phân hủy các pdf bằng cách nào đó vào "tần số thành phần" của mình khi σ=0. Từ eq. (4):

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

khiến chúng ta có tích phân không chính xác của phần biểu thức màu đỏ, tương ứng với biến đổi Fourier của pdf.

Nói chung, trực giác của các cực biến đổi Laplace của hàm sẽ là chúng cung cấp thông tin về các thành phần tần số (phân rã) và tần số của hàm (trong trường hợp này là pdf).


Để trả lời cho câu hỏi dưới các bình luận về việc chuyển đổi từ Xk sang etx , đây là một động thái hoàn toàn chiến lược: một biểu thức không theo từ biểu thức kia. Đây là một ví dụ: Chúng tôi có một chiếc ô tô của riêng mình và chúng tôi có thể tự do lái xe vào thành phố mỗi khi chúng tôi cần chăm sóc một số doanh nghiệp (đọc, tích hợp phương trình (1) dù có khó khăn đến mức nào trong từng khoảnh khắc riêng biệt) . Thay vào đó, chúng ta có thể làm một cái gì đó hoàn toàn khác: chúng ta có thể lái xe đến ga tàu điện ngầm gần nhất (đọc, giải quyết phương trình (2) chỉ một lần) và từ đó sử dụng phương tiện giao thông công cộng để đến mọi nơi chúng ta cần đến (đọc, nhận bất kỳ k dẫn xuất của tích phân trong phương trình(2)k(3)0


2
Làm thế nào E[etX] thay thế E[Xk]? (Hết màu xanh?)
user366312 7/10/2016

2
I wish the laymen who understand this answer were my students :)
Aksakal

3

In the most layman terms it's a way to encode all characteristics of the probability distribution into one short phrase. For instance, if I know that MGF of the distribution is

M(t)=etμ+1/2σ2t2
I can find out the mean of this distribution by taking first term of Taylor expansion:
ddtM(t)|t=0=μ+σ2t|t=0=μ
If you know what you're doing it's much faster than taking the expectation of the probability function.

Moreover, since this MGF encodes everything about the distribution, if you know how to manipulate the function, you can apply operations on all characteristics of the distribution at once! Why don't we always use MGF? First, it's not in every situation the MGF is the easiest tool. Second, MGF doesn't always exist.

Above layman

Suppose you have a standard normal distribution. You can express everything you know about it by stating its PDF:

f(x)=12πex2/2

You can calculate its moment such as mean and standard deviation, and use it on transformed variables and functions on random normals etc.

You can think of the MGF of normal distribution as an alternative to PDF. It contains the same amount of information. I already showed how to obtain the mean.

Why do we need an alternative way? As I wrote, sometimes it's just more convenient. For instance, try calculating the variance of the standard normal from PDF:

σ2=x212πex2/2dx=?
It's not that difficult, but it's much easier to do it with MGF M(t)=et2/2:
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
Can you please expand on the "everything" that it encodes about the distribution?
ColorStatistics

2
To appreciate the point made by @ColorStatistics, please see stats.stackexchange.com/questions/25010.
whuber

@whuber: Thank you, whuber. I'll study that reference. This is a topic I am looking to understand better.
ColorStatistics

How can we prove that MGF & PDF contain the same amount of information?
Aerin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.