Phần đầu của câu hỏi được trả lời trong ý kiến cho câu hỏi: nhiều "thương hiệu" phân phối là đa phương, chẳng hạn như bất kỳ Beta phân phối với một < 1 và b < 1 . Sau đó, hãy chuyển sang phần thứ hai của câu hỏi.(a,b)a<1b<1
Tất cả các phân phối rời rạc là hỗn hợp rõ ràng (của các nguyên tử, không đồng nhất).
Tôi sẽ chỉ ra rằng hầu hết các bản phân phối liên tục cũng là hỗn hợp của các bản phân phối không chính thống. Trực giác đằng sau điều này rất đơn giản: chúng ta có thể "loại bỏ" các va chạm từ một đồ thị gập ghềnh của PDF, từng cái một, cho đến khi đồ thị nằm ngang. Các vết sưng trở thành các thành phần hỗn hợp, mỗi trong số đó rõ ràng là không chính thống.
Do đó, ngoại trừ một số bản phân phối bất thường có tệp PDF không liên tục, câu trả lời cho câu hỏi là "không": tất cả các bản phân phối đa phương thức hoàn toàn liên tục, rời rạc hoặc kết hợp cả hai bản này là hỗn hợp của các bản phân phối không theo phương thức.
Xem xét các bản phân phối liên tục có tệp PDF f liên tục (đây là các bản phân phối "hoàn toàn liên tục"). (Tính liên tục không có nhiều hạn chế; nó có thể được nới lỏng hơn bằng cách phân tích cẩn thận hơn, giả sử chỉ đơn thuần là các điểm gián đoạn là rời rạc.) Ff
Để đối phó với "cao nguyên" của các giá trị không đổi có thể xảy ra, hãy xác định "chế độ" là một khoảng (có thể là một điểm trong đó x l = x u ) sao chom=[xl,xu]xl=xu
có giá trị không đổi trên m , nói y .fm,y
không phải là hằng số trên bất kỳ khoảng nào có chứa m .fm
Có tồn tại một số dương như vậy mà giá trị lớn nhất của f đạt trên [ x l - ε , x u + ε ] bằng y .ϵf[xl−ϵ,xu+ϵ]y
Đặt là bất kỳ chế độ nào của f . Vì f liên tục, nên có các khoảng [ x ′ l , x ′ u ] chứa m mà f không tăng trong [ x ′ l , x l ] (là một khoảng thích hợp, không chỉ là một điểm) và không tăng trong [ x u , x ′ u ]m=[xl,xu]ff[x′l,x′u]mf[x′l,xl][xu,x′u](đó cũng là một khoảng thích hợp). Đặt là cực đại của tất cả các giá trị như vậy và x ′ u là tối cao của tất cả các giá trị đó.x′lx′u
Cấu trúc này đã xác định một "bướu" trên biểu đồ kéo dài từ x ′ l đến x ′ u . Đặt y là lớn hơn của f ( x ′ l ) và f ( x ′ u ) . Bằng cách xây dựng, tập hợp các điểm x trong [ x ' l , x ' u ] mà f ( x ) ≥ y là một khoảng thời gian thích hợp m 'fx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥ym′chứa đúng (vì nó chứa toàn bộ [ x ′ l , x l ] hoặc [ x u , x ′ u ] ).m[x′l,xl][xu,x′u]
Trong hình minh họa này của PDF đa phương thức, chế độ được xác định bằng một dấu chấm màu đỏ trên trục hoành. Mức độ ngang của phần màu đỏ của các điền là khoảng thời gian m ' : nó là cơ sở của các bướu xác định bởi chế độ m . Cơ sở của bướu đó là ở độ cao y ≈ 0,16 . PDF gốc là tổng của màu đỏ và màu xanh lam. Lưu ý rằng màu xanh chỉ có một chế độ gần 2 ; chế độ ban đầu tại [ 0 , 0 ] đã bị xóa.m=[0,0]m′my≈0.162[0,0]
Viết cho chiều dài của m ' , xác định|m′|m′
pm=PrF(m′)−y|m′|
và
fm(x)=f(x)−ypm
khi và f m ( x ) = 0 ngược lại. (Điều này làm cho f m là một hàm liên tục, tình cờ.) Tử số là số lượng mà f tăng lên trên y và mẫu số p m là khu vực giữa đồ thị của f và y . Do đó f m không âm và có tổng diện tích 1 : đó là PDF của phân phối xác suất. Bằng cách xây dựng nó có một chế độ độc đáo m .x∈m′fm(x)=0fmfypmfyfm1m
Cũng bằng cách xây dựng, chức năng
f′m(x)=f(x)−pmfm(x)1−pm
là một tệp PDF được cung cấp . (Rõ ràng là nếu p m = 1 không có gì trái là f , mà phải có được unimodal để bắt đầu với.) Hơn nữa, nó không có chế độ trong khoảng m ' (nơi mà nó là hằng số, đó là lý do tại sao định nghĩa cẩn thận trước của một chế độ như một khoảng là cần thiết). Hơn nữa,pm<1pm=1f,m′
f(x)=pmfm(x)+(1−pm)f′m(x)
là một hỗn hợp của PDF và PDF f ′ m .fmf′m
Lặp lại quy trình này với (mà là sự kết hợp tuyến tính của các hàm liên tục vẫn là một hàm liên tục, cho phép chúng ta tiến hành như trước), tạo ra một chuỗi các chế độ m = m 1 , m 2 , đấm ; trình tự của trọng lượng tương ứng p 1 = p m , p 2 = p m 2 , ... ; và PDF f 1 = f m , f 2 = f m 2 , Rọ .f′mm=m1,m2,…p1=pm,p2=pm2,…f1=fm,f2=fm2,…. Kết quả giới hạn tồn tại bởi vì (a) khoảng thời gian được làm phẳng bao gồm một khoảng thích hợp chưa được làm phẳng trong các phép toán i - 1 trước đó và (b) các số thực không thể được phân tách thành nhiều hơn một số lượng có thể đếm được của các khoảng đó . Giới hạn không thể có bất kỳ chế độ nào và do đó là hằng số, phải bằng 0 (nếu không thì tích phân của nó sẽ phân kỳ). Do đó, f đã được thể hiện (có lẽ không phải là duy nhất, bởi vì thứ tự các chế độ được chọn sẽ quan trọng) như là một hỗn hợpfii−1f
f(x)=∑ipifi(x)
phân phối không chính thống, QED.