Tại sao tất cả các phân phối được biết là không chính thống?


13

Tôi không biết bất kỳ phân phối đa phương thức.

Tại sao tất cả các phân phối được biết là không chính thống? Có phân phối "nổi tiếng" nào có nhiều hơn một chế độ không?

Tất nhiên, hỗn hợp phân phối thường là đa phương thức, nhưng tôi muốn biết liệu có tồn tại bất kỳ phân phối "không hỗn hợp" nào có nhiều hơn một chế độ không.


5
Bạn đang nói về các bản phân phối "tiêu chuẩn" thay vì các bản phân phối "đã biết".
Stéphane Laurent

12
Làm thế nào về phiên bản beta với α=β=0.5 ?
amip nói phục hồi Monica

1
Nếu bạn không bận tâm đến các phân phối lưỡng kim bị ràng buộc , Wikipedia cũng đề cập đến phân phối bậc haiphân phối arcsine . Tôi nghĩ rằng đây chỉ là những trường hợp đặc biệt của bản phân phối beta mặc dù ... Wikipedia cũng đề cập đến một số ví dụ về sự xuất hiện tự nhiên của bản phân phối đa phương thức .
Nick Stauner

12
@ StéphaneLaurent: Tôi thích "phân phối tên thương hiệu" , vì truyền đạt rằng bản thân đã được đặt tên không bao hàm bất kỳ trạng thái đặc biệt nào cho phân phối. Các bản phân phối "Được biết" làm cho nó có vẻ như phần còn lại có thể ở ngoài đó đang chờ được khám phá, như quái vật hồ Loch-Ness hoặc vật chất tối.
Scortchi - Phục hồi Monica

5
Tuyệt vời @Scortchi, từ vựng tuyệt vời! Nhiều nhà khoa học phi toán học mà tôi đã gặp phải có ấn tượng rằng một phân phối không có tên không tồn tại. Có lẽ có một thực tế triết học sâu sắc hơn đằng sau đó, sự nhầm lẫn của một cái tên và sự vật được biểu thị bằng cái tên này (như Russell nói, "Từ" con chó "không giống với một con chó,")
Stéphane Laurent

Câu trả lời:


17

Phần đầu của câu hỏi được trả lời trong ý kiến cho câu hỏi: nhiều "thương hiệu" phân phối là đa phương, chẳng hạn như bất kỳ Beta phân phối với một < 1b < 1 . Sau đó, hãy chuyển sang phần thứ hai của câu hỏi.(a,b)a<1b<1

Tất cả các phân phối rời rạc là hỗn hợp rõ ràng (của các nguyên tử, không đồng nhất).

Tôi sẽ chỉ ra rằng hầu hết các bản phân phối liên tục cũng là hỗn hợp của các bản phân phối không chính thống. Trực giác đằng sau điều này rất đơn giản: chúng ta có thể "loại bỏ" các va chạm từ một đồ thị gập ghềnh của PDF, từng cái một, cho đến khi đồ thị nằm ngang. Các vết sưng trở thành các thành phần hỗn hợp, mỗi trong số đó rõ ràng là không chính thống.

Do đó, ngoại trừ một số bản phân phối bất thường có tệp PDF không liên tục, câu trả lời cho câu hỏi là "không": tất cả các bản phân phối đa phương thức hoàn toàn liên tục, rời rạc hoặc kết hợp cả hai bản này là hỗn hợp của các bản phân phối không theo phương thức.


Xem xét các bản phân phối liên tục có tệp PDF f liên tục (đây là các bản phân phối "hoàn toàn liên tục"). (Tính liên tục không có nhiều hạn chế; nó có thể được nới lỏng hơn bằng cách phân tích cẩn thận hơn, giả sử chỉ đơn thuần là các điểm gián đoạn là rời rạc.) Ff

Để đối phó với "cao nguyên" của các giá trị không đổi có thể xảy ra, hãy xác định "chế độ" là một khoảng (có thể là một điểm trong đó x l = x u ) sao chom=[xl,xu]xl=xu

  1. có giá trị không đổi trên m , nói y .fm,y

  2. không phải là hằng số trên bất kỳ khoảng nào có chứa m .fm

  3. Có tồn tại một số dương như vậy mà giá trị lớn nhất của f đạt trên [ x l - ε , x u + ε ] bằng y .ϵf[xlϵ,xu+ϵ]y

Đặt là bất kỳ chế độ nào của f . Vì f liên tục, nên có các khoảng [ x l , x u ] chứa mf không tăng trong [ x l , x l ] (là một khoảng thích hợp, không chỉ là một điểm) và không tăng trong [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](đó cũng là một khoảng thích hợp). Đặt là cực đại của tất cả các giá trị như vậy và x u là tối cao của tất cả các giá trị đó.xlxu

Cấu trúc này đã xác định một "bướu" trên biểu đồ kéo dài từ x l đến x u . Đặt y là lớn hơn của f ( x l )f ( x u ) . Bằng cách xây dựng, tập hợp các điểm x trong [ x ' l , x ' u ]f ( x ) y là một khoảng thời gian thích hợp m 'fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymchứa đúng (vì nó chứa toàn bộ [ x l , x l ] hoặc [ x u , x u ] ).m[xl,xl][xu,xu]

Nhân vật

Trong hình minh họa này của PDF đa phương thức, chế độ được xác định bằng một dấu chấm màu đỏ trên trục hoành. Mức độ ngang của phần màu đỏ của các điền là khoảng thời gian m ' : nó là cơ sở của các bướu xác định bởi chế độ m . Cơ sở của bướu đó là ở độ cao y 0,16 . PDF gốc là tổng của màu đỏ và màu xanh lam. Lưu ý rằng màu xanh chỉ có một chế độ gần 2 ; chế độ ban đầu tại [ 0 , 0 ] đã bị xóa.m=[0,0]mmy0.162[0,0]

Viết cho chiều dài của m ' , xác định|m|m

pm=PrF(m)y|m|

fm(x)=f(x)ypm

khi f m ( x ) = 0 ngược lại. (Điều này làm cho f m là một hàm liên tục, tình cờ.) Tử số là số lượng mà f tăng lên trên y và mẫu số p m là khu vực giữa đồ thị của fy . Do đó f m không âm và có tổng diện tích 1 : đó là PDF của phân phối xác suất. Bằng cách xây dựng nó có một chế độ độc đáo m .xmfm(x)=0fmfypmfyfm1m

Cũng bằng cách xây dựng, chức năng

fm(x)=f(x)pmfm(x)1pm

là một tệp PDF được cung cấp . (Rõ ràng là nếu p m = 1 không có gì trái là f , mà phải có được unimodal để bắt đầu với.) Hơn nữa, nó không có chế độ trong khoảng m ' (nơi mà nó là hằng số, đó là lý do tại sao định nghĩa cẩn thận trước của một chế độ như một khoảng là cần thiết). Hơn nữa,pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

là một hỗn hợp của PDF và PDF f m .fmfm

Lặp lại quy trình này với (mà là sự kết hợp tuyến tính của các hàm liên tục vẫn là một hàm liên tục, cho phép chúng ta tiến hành như trước), tạo ra một chuỗi các chế độ m = m 1 , m 2 , đấm ; trình tự của trọng lượng tương ứng p 1 = p m , p 2 = p m 2 , ... ; và PDF f 1 = f m , f 2 = f m 2 , Rọ .fmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,. Kết quả giới hạn tồn tại bởi vì (a) khoảng thời gian được làm phẳng bao gồm một khoảng thích hợp chưa được làm phẳng trong các phép toán i - 1 trước đó và (b) các số thực không thể được phân tách thành nhiều hơn một số lượng có thể đếm được của các khoảng đó . Giới hạn không thể có bất kỳ chế độ nào và do đó là hằng số, phải bằng 0 (nếu không thì tích phân của nó sẽ phân kỳ). Do đó, f đã được thể hiện (có lẽ không phải là duy nhất, bởi vì thứ tự các chế độ được chọn sẽ quan trọng) như là một hỗn hợpfii1f

f(x)=ipifi(x)

phân phối không chính thống, QED.


7

Theo unimodal, tôi nghĩ OP rõ ràng có nghĩa là chỉ có một chế độ bên trong (tức là không bao gồm các giải pháp góc). Vì vậy, câu hỏi thực sự là hỏi ...

why is it that brand name distributions do NOT have more than one interior mode?

tức là tại sao hầu hết các bản phân phối thương hiệu trông giống như thế này:

nhập mô tả hình ảnh ở đây

... cộng hoặc trừ một số sai lệch hoặc một số điểm không liên tục? Khi câu hỏi được đặt ra, phân phối Beta sẽ không phải là một ví dụ truy cập hợp lệ.

Có vẻ như phỏng đoán của OP có một số giá trị: hầu hết các phân phối tên thương hiệu phổ biến không cho phép nhiều hơn một chế độ nội thất. Có thể có lý do lý thuyết cho việc này. Ví dụ: bất kỳ phân phối nào là thành viên của gia đình Pearson (bao gồm cả Beta) sẽ nhất thiết phải là (không có nội bộ), do hậu quả của sự khác biệt cha mẹ xác định toàn bộ gia đình. Và gia đình Pearson làm tổ hầu hết các tên thương hiệu nổi tiếng nhất.

Tuy nhiên, đây là một số ví dụ về thương hiệu ...

Ví dụ truy cập

Một ví dụ về tên thương hiệu là bản phân phối với pdf:Sinc2

f(x)=sin2(x)πx2

được xác định trên dòng thực. Dưới đây là một âm mưu của pdf:Sinc2

nhập mô tả hình ảnh ở đây

Có lẽ chúng ta cũng có thể thêm họ cardiod và các bản phân phối liên quan đến lớp này ... với các lô pdf như:

nhập mô tả hình ảnh ở đây

Gia đình phân phối thương hiệu được phản ánh có lẽ cũng có thể là đối thủ của thương hiệu (mặc dù, những điều này có thể được coi là "giải pháp gian lận" ... nhưng chúng vẫn là tên thương hiệu) như Reflected Weibull được hiển thị ở đây:

nhập mô tả hình ảnh ở đây


1
Sinc2

1
Hi @whuber ... phải đồng ý tái artefact âm mưu (Tôi sẽ đi mà lên trên Mathematica SE!). Gia đình cardiod: ý tưởng là người ta có thể mở rộng lãnh địa của những gia đình như vậy, và giống như một làn sóng hình sin, nó tiếp tục cho đi :)
con sói

1
Sinc2

Tôi nghĩ rằng đó chỉ là do đường kẻ được vẽ dày hơn đường trục, do đó xuất hiện để 'vượt quá' trục khi gần bằng không. Nếu đường kẻ được vẽ mỏng hơn, vật phẩm sẽ biến mất.
chó sói

Nhưng không có tạo tác nào như vậy trong hình dưới của bạn, nó cũng có các đường kẻ dày hơn trục.
whuber

3

Rằng bạn có thể không nghĩ về bất kỳ điều gì không có nghĩa là không có.

Tôi có thể đặt tên cho các bản phân phối "đã biết" không khác thường.

αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

cũng thấy

http://en.wikipedia.org/wiki/U-quadratic_distribution

(Đây không phải là trường hợp đặc biệt của bản phân phối beta, mặc dù bình luận nói rằng đó là. Tuy nhiên, hai gia đình có một số chồng chéo, tuy nhiên.)

Phân phối hỗn hợp chắc chắn được biết đến, và nhiều trong số đó là đa phương thức.


U-quadratic là một bản phân phối Beta bị cắt ngắn.
becko

1

Phân phối Alpha-skew-normal (Elal-Olivero 2010) có bản PDF:

(1-αx-μσ)2+12+α2φ(x-μσ),

Ở đâu φ là bản PDF của một Gaussian tiêu chuẩn.

Dành cho |α|>1,34phân phối là lưỡng kim. Âm mưu kiểm tra choμ= =1,σ= =0,5,một= =2:

enter image description here

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.