Phương sai của hỗn hợp có trọng số của hai gaussian là gì?


39

Giả sử tôi có hai bản phân phối bình thường A và B với phương tiện và và phương sai và . Tôi muốn lấy hỗn hợp có trọng số của hai phân phối này bằng cách sử dụng trọng số và trong đó và . Tôi biết rằng giá trị trung bình của hỗn hợp này sẽ là .μ B σ A σ B p q 0 p 1 q = 1 - p μ A B = ( p × μ A ) + ( q × μ B )μAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB)

Phương sai sẽ là gì?


Một ví dụ cụ thể sẽ là nếu tôi biết các thông số phân bố chiều cao nam và nữ. Nếu tôi có một phòng gồm 60% nam giới, tôi có thể tạo ra chiều cao trung bình dự kiến ​​cho toàn bộ phòng, nhưng còn phương sai thì sao?


Thuật ngữ Re: Hỗn hợp đơn giản có một giá trị trung bình và phương sai; không có ý nghĩa trong việc coi những điều này là "mong đợi", trừ khi bạn có thể gợi ý rằng và nên được coi là các biến ngẫu nhiên. qpq
whuber

Tôi biết rằng hỗn hợp của hai phân phối gaussian là có thể xác định được. Nhưng nếu hai bản phân phối có cùng một emans? Tức là: là hỗn hợp của hai phân phối bình thường có cùng phương tiện và độ lệch chuẩn khác nhau có thể xác định được không? Có giấy tờ trong bối cảnh này? Cảm ơn trước

1
Có một câu hỏi tương tự với câu trả lời (cũng liên quan đến COVARIANCES
hplieninger 17/03/2016

Câu trả lời:


63

Phương sai là khoảnh khắc thứ hai trừ đi bình phương của khoảnh khắc đầu tiên, do đó, nó đủ để tính toán các khoảnh khắc của hỗn hợp.

Nói chung, các bản phân phối đã cho có PDF và trọng số không đổi (không ngẫu nhiên) , PDF của hỗn hợp làp iftôiptôi

f(x)= =Σtôiptôiftôi(x),

từ đó nó sau ngay lập tức cho bất kỳ thời điểm màk

μ(k)= =Ef[xk]= =ΣtôiptôiEftôi[xk]= =Σtôiptôiμtôi(k).

Tôi đã viết cho khoảnh khắc của và cho khoảnh khắc của .μ(k) f μ ( k ) i kkthfμi(k) f ikthfi

Sử dụng các công thức này, phương sai có thể được viết

Var(f)= =μ(2)-(μ(1))2= =Σtôiptôiμtôi(2)-(Σtôiptôiμtôi(1))2.

Tương đương, nếu phương sai của được cho là σ 2 i , thì , cho phép phương sai của hỗn hợp được viết theo phương sai và phương tiện của các thành phần của nó nhưftôiσtôi2fμtôi(2)= =σtôi2+(μtôi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

Nói cách khác, đây là phương sai trung bình (có trọng số) cộng với trung bình bình phương trừ đi bình phương trung bình. Vì bình phương là một hàm lồi, Bất đẳng thức của Jensen khẳng định rằng trung bình bình phương trung bình có thể không nhỏ hơn bình phương trung bình. Điều này cho phép chúng ta hiểu công thức khi nêu phương sai của hỗn hợp là hỗn hợp của phương sai cộng với một thuật ngữ không âm cho sự phân tán (có trọng số) của phương tiện.

Trong trường hợp của bạn, phương sai là

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

Chúng ta có thể hiểu đây là một hỗn hợp có trọng số của hai phương sai, , cộng với một thuật ngữ điều chỉnh (nhất thiết là tích cực) để tính đến sự dịch chuyển từ các phương tiện riêng lẻ so với trung bình tổng thể.pAσA2+pBσB2

Tiện ích của phương sai này trong việc diễn giải dữ liệu, như được đưa ra trong câu hỏi, rất đáng nghi ngờ, bởi vì phân phối hỗn hợp sẽ không bình thường (và có thể rời khỏi nó, đến mức độ thể hiện tính lưỡng tính).


8
pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2

2
ApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpqE[Y2](E[Y])2

1
@Neodyme Theo định nghĩa, phương sai là khoảnh khắc thứ hai trừ bình phương trung bình. Do đó, khoảnh khắc thứ hai là phương sai cộng với bình phương trung bình.
whuber

1
@Neodyme sử dụng . E(X)=μ
whuber

1
@Kiran Mặc dù trong một số trường hợp, hỗn hợp có thể trông bình thường, nhưng nó sẽ không như vậy. Một cách để thấy điều đó là tính toán mức độ tổn thương dư thừa của nó bằng cách sử dụng các công thức được đưa ra ở đây. Nó sẽ là khác thường trừ khi tất cả các độ lệch chuẩn là bằng nhau - trong trường hợp đó, "hỗn hợp" không thực sự là một hỗn hợp ở vị trí đầu tiên.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.