Counterexamples nơi Median nằm ngoài [Chế độ trung bình]


11

Bài viết này nằm trên giải đấu của tôi nhưng nó nói về một chủ đề mà tôi quan tâm, mối quan hệ giữa trung bình, chế độ và trung bình. Nó nói rằng :

Người ta tin rằng trung bình của một phân phối không chính thống là "thường" giữa giá trị trung bình và chế độ. Tuy nhiên, điều này không phải luôn luôn đúng...

Câu hỏi của tôi : ai đó có thể cung cấp các ví dụ về phân phối unimodal (lý tưởng đơn giản) liên tục trong đó trung vị nằm ngoài khoảng [chế độ, trung bình] không? Ví dụ một phân phối như mode < mean < median.

=== CHỈNH SỬA =======

Đã có câu trả lời tốt của Glen_b và Francis, nhưng tôi nhận ra rằng điều tôi thực sự quan tâm là một ví dụ trong đó chế độ <mean <median hoặc median <mean <có nghĩa là cả hai chế độ nằm ngoài [chế độ, có nghĩa là] và trung vị là "Ở cùng một phía" là giá trị trung bình của chế độ (nghĩa là cả chế độ trên hoặc dưới)). Tôi có thể chấp nhận các câu trả lời ở đây đang mở một câu hỏi mới hoặc có thể ai đó có thể đề xuất một giải pháp trực tiếp ở đây?


Không có vấn đề gì để mở rộng câu trả lời cho trường hợp hạn chế hơn.
Glen_b -Reinstate Monica

2
Kiểm tra hình 6 ở đây: ww2.amstat.org/publications/jse/v13n2/vonhippel.html đưa ra một ví dụ Weibull (liên tục không chính thống) trong đó trung vị không nằm giữa chế độ và giá trị trung bình.
Tháp Matthew

Câu trả lời:


14

Chắc chắn, không khó để tìm thấy các ví dụ - ngay cả những ví dụ không liên tục - trong đó trung vị không nằm giữa giá trị trung bình và chế độ.

  1. Hãy xem xét iid từ phân phối tam giác có dạngf T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Bây giờ hãy để là hỗn hợp 60-40 của và .T 1 - 4 T 2XT14T2

    Mật độ của trông như thế này:X

    Hỗn hợp của hai mật độ tam giác với trung vị ngoài khoảng trung bình chế độ

    Giá trị trung bình dưới 0, chế độ ở mức 0, nhưng trung vị là trên 0. Một sửa đổi nhỏ của điều này sẽ mang lại một ví dụ trong đó ngay cả mật độ (chứ không chỉ là cdf) là liên tục, nhưng mối quan hệ giữa các biện pháp vị trí là giống nhau (chỉnh sửa: xem 3. bên dưới).

  2. Tổng quát hóa, hãy đặt tỷ lệ (với ) của tổng xác suất vào tam giác bên phải và tỷ lệ vào tam giác bên trái (thay cho 0,6 và 0,4 chúng tôi đã có trước đây). Hơn nữa, tạo hệ số tỷ lệ ở nửa bên trái thay vì (với ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1p)β4β>0

    mật độ cho phiên bản tổng quát của hỗn hợp hai mật độ tam giác

    Bây giờ giả sử , trung vị sẽ luôn nằm trong khoảng được bao phủ bởi tam giác vuông, do đó trung vị sẽ vượt quá chế độ (sẽ luôn duy trì ở mức ). Cụ thể, khi , trung vị sẽ ở mức . 0p>1p>120 1-1/p>1211/2p

    Giá trị trung bình sẽ là .(pβ(1p))/3

    Nếu thì giá trị trung bình sẽ ở dưới chế độ và nếu thì giá trị trung bình sẽ ở trên chế độ.β>p/(1p)β<p/(1p)

    Mặt khác, chúng tôi muốn giữ giá trị trung bình dưới mức trung bình.(pβ(1p))/3<11/2p

    Xét ; Điều này đặt trung vị trên chế độ.p=0.7

    Sau đó sẽ thỏa mãn nên giá trị trung bình nằm trên chế độ.β=2β<p/(1p)

    Giá trị trung bình thực tế là trong khi giá trị trung bình là . Do đó với và , chúng ta có chế độ <mean <median.11/1.40.15480.72(0.3)30.0333p=0.7β=2

    (NB Để thống nhất với ký hiệu của tôi, biến trên trục x cho cả hai ô nên là chứ không phải nhưng tôi sẽ không quay lại và sửa nó.)xt

  3. Đây là một ví dụ trong đó mật độ chính nó là liên tục. Nó dựa trên cách tiếp cận trong 1. và 2. ở trên, nhưng với "bước nhảy" được thay thế bằng độ dốc cao (và sau đó toàn bộ mật độ lật khoảng 0 vì tôi muốn một ví dụ có vẻ lệch phải).

    mật độ tuyến tính liên tục, từng phần với trung vị <mean <mode

    [Sử dụng phương pháp "hỗn hợp mật độ tam giác", nó có thể được tạo ra dưới dạng hỗn hợp của 3 biến thiên tỷ lệ độc lập của dạng tam giác được mô tả trong phần 1. Hiện tại chúng tôi có 15% , 60% và 25% .]T13T25T3

    Như chúng ta thấy trong sơ đồ trên, giá trị trung bình nằm ở giữa, theo yêu cầu.


  1. Lưu ý rằng m_t_ đề cập đến Weibull trong các nhận xét (trong đó trung vị nằm ngoài khoảng cho một phạm vi nhỏ của tham số hình dạng ). Điều này có khả năng đáp ứng bởi vì nó là một phân phối liên tục (và trơn tru) nổi tiếng với hình thức chức năng đơn giản.[mode,mean]k

    Đặc biệt, đối với các giá trị nhỏ của tham số hình dạng Weibull, phân phối là lệch phải và chúng ta có tình huống trung bình giữa chế độ và giá trị trung bình, trong khi đối với các giá trị lớn của tham số hình dạng Weibull, phân phối bị lệch trái và một lần nữa chúng ta có tình huống "trung vị ở giữa" (nhưng bây giờ với chế độ ở bên phải thay vì trung bình). Ở giữa những trường hợp đó là một vùng nhỏ trong đó dải phân cách nằm ngoài khoảng chế độ trung bình và ở giữa khoảng đó trung bình và chế độ giao nhau:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Chọn các giá trị thuận tiện cho tham số hình dạng trong các khoảng được đánh dấu (1) và (2) ở trên - các giá trị trong đó khoảng cách giữa các thống kê vị trí gần bằng nhau - chúng tôi nhận được:

    Mật độ Weibull với trung vị ngoài khoảng trung bình chế độ

    Mặc dù các yêu cầu này đáp ứng các yêu cầu, nhưng không may là ba tham số vị trí gần nhau đến mức chúng ta không thể phân biệt chúng một cách trực quan (tất cả chúng đều nằm trong cùng một pixel), điều này hơi đáng thất vọng - các trường hợp cho các ví dụ trước đây của tôi nhiều hơn ly thân. (Tuy nhiên, nó gợi ý các tình huống để kiểm tra với các bản phân phối khác, một số trong đó có thể đưa ra kết quả khác biệt rõ ràng hơn.)


Điều đó làm việc, cảm ơn. Vì tò mò, điều gì sẽ là một "phân phối tam giác" tương tự trong đó chế độ <có nghĩa là <trung bình? (ở đây trung vị <mode <mean)
Janthelme

Trên thực tế trong ví dụ ban đầu của tôi có nghĩa là <mode <median; bạn đã có sự bất bình đẳng lạc hậu ở đó. Bây giờ tôi đã thêm một ví dụ tương tự trong đó giá trị trung bình ở trên chế độ nhưng bên dưới trung vị (thực sự, bạn có thể chỉ cần thay thế ban đầu bằng và giữ tỷ lệ hỗn hợp ở mức cho phần bên phải và cho phần bên phải phần bên trái). 4T21.25T20.60.4
Glen_b -Reinstate Monica

6

Ví dụ sau đây được lấy từ Counterexamples của Jordan Stoyanov trong Xác suất .

Cho hằng số dương và , hãy xem xét một biến ngẫu nhiên có mật độ Có thể tìm thấy trung bình , trung vị và chế độ của là Lưu ý là mật độ nếu Vì vậy, nếu chúng ta để thì . Kết quả là, nếu chúng ta chọn một gần vớicλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c1λ2c>111,0001μ>cM=cmμM
c22+cλ=1.
c1λ2c>11 (nói ), chúng ta có thể thấy rằng và , vì vậy trung bình không rơi giữa và .1.0001μ>cM=cmμM

0

Lấy phân bố mũ với tham số tỷ lệ a và mật độ exp (-ax) cho 0 <= x <vô cùng. Chế độ ở mức 0. Tất nhiên giá trị trung bình và trung vị lớn hơn 0. Cdf là 1-exp (-ax). Vậy đối với giải trung vị cho exp (-ax) = 0,5 cho x. Khi đó -ax = ln (0,5) hoặc x = -ln (0,5) / a. Đối với giá trị trung bình tích hợp ax exp (-ax) từ 0 đến vô cùng. Lấy a = 1 và ta có trung vị = -ln (0,5) = ln (2) và mean = 1.

Vì vậy, chế độ <trung bình <có nghĩa.


1
Xin lỗi, nhưng không phải chúng ta đang tìm kiếm các bản phân phối trong đó chế độ <có nghĩa là <trung bình (hay nói chung hơn là trung vị nằm ngoài [chế độ, trung bình])?
Janthelme

3
Xin lỗi vì sự nhầm lẫn, tôi đã thêm vào câu hỏi ban đầu, nhưng những gì tôi đã hỏi ban đầu là cho các ví dụ trong đó trung vị nằm ngoài [chế độ, có nghĩa là] trong khi tôi nghĩ rằng trung vị nằm trong [chế độ, trung vị] trong ví dụ của bạn.
Janthelme

3
Michael, câu hỏi không yêu cầu một trường hợp trung vị nằm giữa chế độ và giá trị trung bình. Bạn đánh giá sai bản gốc trong bình luận của bạn ngay phía trên cái này; câu hỏi không nói "chế độ <trung bình <có nghĩa là" nơi bạn nói rằng nó (và chưa bao giờ được thực hiện tại bất kỳ thời điểm nào trong lịch sử chỉnh sửa). Do đó, câu trả lời của bạn cung cấp một trường hợp không được yêu cầu; thực sự đó là tình huống thông thường (trung vị ở giữa hai người kia) mà câu hỏi tìm kiếm ngoại lệ. Hầu như bất kỳ phân phối không chính thống nổi tiếng nào đều có trung vị ở giữa - mẹo là tìm những thứ không làm được điều đó.
Glen_b -Reinstate Monica

1
Lịch sử chỉnh sửa có sẵn bằng cách nhấp vào liên kết màu đỏ ở cuối câu hỏi hiện đang nói "đã chỉnh sửa 18 giờ trước" (nó đã thay đổi thành 19 trong khi tôi đang gõ những bình luận này). Bạn có thể xem lịch sử chỉnh sửa bằng cách nhấp vào đó. Câu hỏi đã được đăng 22 giờ trước (khi tôi gõ câu hỏi này) và khi bạn nhấp vào lịch sử chỉnh sửa, câu hỏi ban đầu có thể được nhìn thấy ở phía dưới có nhãn "1". Câu trả lời của bạn xuất hiện khoảng 2 giờ sau (20 giờ trước), khi đó là những gì câu hỏi vẫn nói. Khoảng 1-2 giờ sau bài đăng của bạn, OP đã chỉnh sửa câu hỏi của họ một lần, có thể thấy ...
Glen_b -Reinstate Monica

1
ctd ... ở đầu lịch sử chỉnh sửa .. Có một cửa sổ hai phút sau mỗi lần chỉnh sửa để thực hiện các thay đổi được tính là một phần của chỉnh sửa đó (tức là lúc 22 giờ trước và lúc 18-19 giờ trước có hai cửa sổ phút mỗi lần nói lỗi đánh máy có thể đã được sửa) nhưng ~ 20 giờ trước khi bạn đăng, câu hỏi đã không thay đổi trong khoảng 2 giờ và nó vẫn không thay đổi trong hơn một giờ sau khi bạn đăng, khi một chỉnh sửa lớn ( hiển thị trong lịch sử chỉnh sửa) đã được thực hiện. Mọi chỉnh sửa bên ngoài các cửa sổ chỉnh sửa sau hai phút ngắn ngủi đó sẽ nằm trong lịch sử chỉnh sửa.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.