Ai đó có thể đưa ra một ví dụ về phân phối không chính thống có độ lệch bằng 0 nhưng không đối xứng?


31

Vào tháng 5 năm 2010, người dùng Wikipedia Mcorazao đã thêm một câu vào bài viết sai lệch rằng "Giá trị 0 chỉ ra rằng các giá trị được phân phối tương đối đồng đều trên cả hai mặt của giá trị trung bình, thông thường nhưng không nhất thiết có nghĩa là phân phối đối xứng." Tuy nhiên, trang wiki không có ví dụ thực tế về phân phối phá vỡ quy tắc này. Googling "phân phối bất đối xứng ví dụ với độ lệch bằng không" cũng không đưa ra ví dụ thực tế nào, ít nhất là trong 20 kết quả đầu tiên.

Sử dụng định nghĩa độ nghiêng được tính bởi và R công thứcE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Tôi có thể xây dựng một phân phối nhỏ, tùy ý để làm cho độ lệch thấp. Ví dụ: phân phối

x = c(1, 3.122, 5, 4, 1.1) 

mang lại độ lệch . Nhưng đây là một mẫu nhỏ và hơn nữa độ lệch so với đối xứng là không lớn. Vì vậy, có thể xây dựng một phân phối lớn hơn với một đỉnh rất bất đối xứng nhưng vẫn có độ lệch gần bằng không?5.64947105


3
Bạn có muốn phân phối là không chính thống hay không? Tiêu đề nói như vậy, nhưng văn bản hầu như không đề cập đến điểm này.
Dilip Sarwate

@Dilip Vâng, tôi sẽ thấy thú vị hơn nếu phân phối là không chính thống, vì sự sai lệch, như một thời điểm trung tâm, không thực sự có ý nghĩa khác.
Andy McKenzie

Câu trả lời:


28

Xem xét phân phối rời rạc. Một giá trị được hỗ trợ trên giá trị được xác định bởi xác suất không âm tuân theo các điều kiện (a) chúng tổng hợp thành 1 và (b) hệ số độ lệch bằng 0 (tương đương với thời điểm trung tâm thứ ba bằng không). Điều đó để lại độ tự do (theo nghĩa giải phương trình, không phải là thống kê!). Chúng ta có thể hy vọng tìm ra giải pháp không chính thống.x 1 , x 2 , Hoài , x k p 1 , p 2 , Góc , p k k - 2kx1,x2,,xkp1,p2,,pkk2

Để làm cho việc tìm kiếm các ví dụ dễ dàng hơn, tôi đã tìm các giải pháp được hỗ trợ trên một vectơ đối xứng nhỏ với chế độ duy nhất ở mức , không có nghĩa và độ lệch bằng không. Một giải pháp như vậy là .0 ( p 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47.386 , 8781 , 3930 , 1235 ) / 75.600x=(3,2,1,0,1,2,3)0(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Hàm xác suất

Bạn có thể thấy nó không đối xứng.

Đây là một giải pháp bất đối xứng rõ ràng hơn với (không đối xứng) và :p = ( 1 , 18 , 72 , 13 , 4 ) / 108x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Hàm xác suất 2

Bây giờ rõ ràng điều gì đang xảy ra: vì giá trị trung bình bằng , các giá trị âm đóng góp và đến giây thứ ba trong khi các giá trị dương đóng góp và , cân bằng chính xác các đóng góp tiêu cực. Chúng ta có thể có phân phối đối xứng khoảng , chẳng hạn như với và thay đổi khối lượng nhỏ từ đến , một khối lượng nhỏ từ xuống và một khối lượng nhỏ xuống( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( - 1 , 0 , 1 ) p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 - 10(3)3=2718×(1)3=184×23=3213×13=130x=(1,0,1)p=(1,4,1)/6+1+2+110 03, giữ giá trị trung bình ở mức và độ lệch là , đồng thời tạo ra sự bất đối xứng. Cách tiếp cận tương tự sẽ hoạt động để duy trì giá trị trung bình bằng 0 và độ lệch của phân phối liên tục trong khi làm cho nó không đối xứng; nếu chúng ta không quá tích cực với sự thay đổi hàng loạt, nó sẽ vẫn không bình thường.00


Chỉnh sửa: Phân phối liên tục

Bởi vì vấn đề liên tục xuất hiện, chúng ta hãy đưa ra một ví dụ rõ ràng với các bản phân phối liên tục. Peter Flom đã có một ý tưởng tốt: nhìn vào hỗn hợp của các quy tắc. Một hỗn hợp của hai quy tắc sẽ không làm: khi độ lệch của nó biến mất, nó sẽ đối xứng. Trường hợp đơn giản tiếp theo là một hỗn hợp của ba quy tắc.

Hỗn hợp của ba quy tắc, sau khi lựa chọn vị trí và tỷ lệ thích hợp, phụ thuộc vào sáu tham số thực và do đó cần có đủ độ linh hoạt để tạo ra một giải pháp độ lệch không đối xứng, không đối xứng. Để tìm một số, chúng ta cần biết cách tính độ lệch của hỗn hợp các quy tắc. Trong số này, chúng tôi sẽ tìm kiếm bất kỳ cái gì không chính thống (có thể là không có).

Bây giờ, nói chung, thời điểm (không phải trung tâm) của phân phối chuẩn thông thường bằng 0 khi là số lẻ và nếu không bằng . Khi chúng tôi hủy bỏ phân phối chuẩn thông thường để có độ lệch chuẩn là , thời điểm được nhân với . Khi chúng tôi thay đổi bất kỳ phân phối nào theo , khoảnh khắc có thể được biểu thị theo các khoảnh khắc lên đến và bao gồm rrthr σrthứσr2r/2Γ(1r2)/πσrthσrμrthr. Khoảnh khắc của một hỗn hợp phân phối (nghĩa là trung bình có trọng số của chúng) là trung bình có trọng số tương tự của các khoảnh khắc riêng lẻ. Cuối cùng, độ lệch bằng 0 chính xác khi khoảnh khắc trung tâm thứ ba bằng 0 và điều này dễ dàng được tính theo ba thời điểm đầu tiên.

Điều này cho chúng ta một cuộc tấn công đại số vào vấn đề. Một giải pháp tôi tìm thấy là một hỗn hợp bằng nhau của ba quy tắc với các tham số bằng , và . Giá trị trung bình của nó bằng . Hình ảnh này cho thấy pdf có màu xanh lam và pdf của bản phân phối lật về ý nghĩa của nó bằng màu đỏ. Rằng họ khác nhau cho thấy cả hai đều không đối xứng. (Chế độ xấp xỉ , không bằng giá trị trung bình của .) Cả hai đều có độ lệch bằng không khi xây dựng .(μ,σ)(0,1)(1/2,1)(0+1/2+0)(0,127/18)(0,2.65623)(0+1/2+0)/3=1/61 / 60.05192161/6

Ví dụ liên tục

Các lô cho thấy đây là không chính thống. (Bạn có thể kiểm tra bằng tính toán để tìm cực đại cục bộ.)


(+1) Câu trả lời rất lắt léo. Điều này sẽ làm việc với phân phối liên tục mặc dù? Không phải sự thay đổi có khả năng tạo ra các chế độ nhỏ bé? Tôi có thể không suy nghĩ thẳng ...
Macro

1
Bạn đang suy nghĩ khá tốt, Macro: tất cả chúng ta nên quá hoài nghi. Bí quyết là để thay đổi số lượng nhỏ trải rộng trên phạm vi rộng. Thử nghiệm phái sinh đầu tiên sẽ cho phép bạn kiểm tra các chế độ có thể và cũng cung cấp cơ sở cho một bằng chứng cho thấy những thay đổi đủ nhỏ của hình thức này sẽ không tạo ra các chế độ mới.
whuber

Cảm ơn câu trả lời! Điều này tương tự như những gì tôi đã suy nghĩ bằng trực giác, mặc dù tôi không thể diễn đạt thành lời - rằng bạn phải "cân bằng" khối lượng ở mỗi bên của bản phân phối. Làm cho tôi tự hỏi nếu có những cách rập khuôn trong đó người ta có thể thực hiện hành động cân bằng này.
Andy McKenzie

Một cách, Andy, là bắt đầu với một giải pháp riêng biệt và sau đó kết hợp nó với một phân phối bình thường. Trong trường hợp này, yêu cầu không đồng nhất sẽ buộc phân phối bình thường đó có độ lệch chuẩn lớn. Mặc dù vậy, nếu tích chập không thay đổi đáng kể các thuộc tính cần thiết (chẳng hạn như độ lệch bằng 0) hoặc nó thay đổi nó theo những cách có thể dự đoán được, bạn có cách xử lý toán học cho vấn đề. Trong một số trường hợp, bản chỉnh sửa gần đây của tôi có thể được xem là một cuộc tấn công như vậy, mặc dù nó không hoàn toàn là một tổ hợp (vì ba quy tắc có độ lệch chuẩn khác nhau).
whuber

2
Tôi đã kiểm tra, Andy: kết hợp giải pháp rời rạc với phân phối bình thường không làm thay đổi độ lệch. Khi bạn cung cấp cho phân phối bình thường đó độ lệch chuẩn khoảng 0,57 hoặc cao hơn, kết quả là không chính thống. Giống như phân phối rời rạc bên dưới, nó tiếp tục có giá trị trung bình bằng 0, độ lệch bằng 0 và không đối xứng. Kết hợp điều này với một lượng phân phối chuẩn thông thường cho một chuyển động có khối lượng được kiểm soát giữa phân phối chuẩn và phân phối rời rạc: có thể đáp ứng yêu cầu của bạn về phương pháp "rập khuôn".
whuber

23

Đây là một cái tôi tìm thấy tại https://www.qualitydigest.com/inside/quality-insider-article/probols-skewness-and-kurtosis-part-one.html# mà tôi thấy đẹp và được sao chép trong R: một Burr nghịch đảo hoặc phân phối Dagum với các tham số hình dạng c = 18.1484 :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Nó có nghĩa là 0,5387, độ lệch chuẩn 0,907, độ lệch 0,0000 và kurtosis 2,0000. Nguồn này cũng gọi đó là "phân phối voi": enter image description here

Bản sao của tôi trong R được tạo ra với

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Như đầu ra này cho thấy, độ lệch không hoàn toàn từ 0 đến 4 chữ số cho các giá trị tham số này. Đây là một trình tối ưu hóa nhỏ cho c :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

năng suất

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

Cảm ơn bạn đã chỉnh sửa. Điều đó nói rằng, tôi không thể tái tạo độ lệch của 0,0000 đến bốn chữ số, thay vào đó lấy 0,0001245138 (xem chỉnh sửa tiếp theo, trong mã R).
Christoph Hanck

ck

Trên thực tế, 0,0003756196. 0,0001245138 đã có sau một số tối ưu hóa ban đầu, do nhầm lẫn ở đây. Tôi sẽ có một cái nhìn.
Christoph Hanck

@amoeba, tôi đã cố gắng tối ưu hóa một chút, nhưng tôi không tuyên bố rằng đã làm điều đó một cách thông minh, tôi có ít kinh nghiệm về tối ưu hóa.
Christoph Hanck

2
Skewness đó là 0 đến 3 chữ số (gần bốn chữ số) là rất nhiều đối với tôi; nó không giống như một giá trị chính xác hơn sẽ làm cho nó trông khác đi. Nếu độ lệch sẽ vượt qua 0 trong vùng lân cận đó và rõ ràng hướng nào để điều chỉnh các giá trị nếu cần độ chính xác cao hơn, tôi cho rằng điều đó là đủ. Nhưng kudos cho những nỗ lực bổ sung. (Nhân tiện, đây là một ví dụ đáng yêu.)
Glen_b -Reinstate Monica

9

Xem xét phân phối trên nửa dương của dòng thực tăng tuyến tính từ 0 đến chế độ và sau đó theo cấp số nhân ở bên phải của chế độ, nhưng liên tục ở chế độ.

Điều này có thể được gọi là phân bố theo cấp số mũ (mặc dù nó thường trông hơi giống vây cá mập).

θλ

λθλθ6.15

Triangular-Exponential with zero skewness

[1][2]

Các phân phối không bình thường với độ lệch bằng không và độ nhiễu quá mức? có một số ví dụ không đối xứng, bao gồm một ví dụ nhỏ rời rạc và một ví dụ khác không liên tục:

Unimodal Gaussian mixture with zero skewness

Các bản phân phối không theo phương thức riêng biệt - hoặc tương đương, các mẫu - với độ lệch bằng 0 khá dễ dàng để xây dựng, có kích thước lớn hoặc nhỏ.

Dưới đây là một ví dụ, bạn có thể coi là một mẫu hoặc (bằng cách chia tần số thô cho 3000) là một pmf (các giá trị 'x' là các giá trị được lấy, 'n' là số lần giá trị đó xảy ra trong mẫu ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

A plot of the probability mass function constructed from the above

Ví dụ này được xây dựng từ các bản phân phối 3 điểm:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccinixi=0inixi3=0c

Có tất cả cách thức của các "nguyên tử" khác mà người ta có thể xây dựng, nhưng ví dụ này chỉ sử dụng loại này. Đối với một số kết hợp các nguyên tử như vậy, chúng được thêm vào một vài giá trị được đặt đối xứng để điền vào các lỗ còn lại và đảm bảo tính không đồng nhất mà không phá hủy cấu trúc của thời điểm trung bình và giây.

[1]


[2]



3
Có lẽ có thể gọi nó là "vây cá mập"?
Glen_b -Reinstate Monica

@Glen_b Hoàn toàn là vây cá mập.
Alecos Papadopoulos

2

Chắc chắn rồi. Thử đi:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Bạn đã làm những thứ khó khăn rồi!)


1
tuyệt tôi thích nó. +1
gung - Phục hồi Monica

4
Nó không phải là lưỡng tính ... nó là đa phương thức khủng khiếp . Hãy thử vẽ đồ thị mật độ; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
khách

1
Dữ liệu được tạo ra theo cách này chắc chắn không phải là không chính thống. Tất cả bạn cần làm để thấy đó là cắt và dán mã của bạn, nguyên văn. Thật vậy, một hỗn hợp các biến phân phối thông thường sẽ không bao giờ là không đồng nhất (trừ khi tất nhiên, một trong các tỷ lệ hỗn hợp là 1).
Macro

8
@Macro, điều đó không đúng. Xem, ví dụ, bản tóm tắt của Roeder 1994 (JASA) cho kết quả nổi tiếng rằng "mật độ của hai quy tắc hỗn hợp không phải là lưỡng kim trừ khi các phương tiện được phân tách bằng ít nhất 2 độ lệch chuẩn". Nếu chúng được phân tách bằng ít hơn thế này, hỗn hợp là không đồng nhất.
khách

1
Bạn nói đúng @guest. Tôi đã quên mất khả năng đó khi tôi thực hiện bài đăng của mình
Macro

2

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

Bây giờ, với giá trị trung bình và phương sai đã cho, chọn bất kỳ hai phân phối YZ với khối lượng bằng không ở phía bên phải của μ

E[(Y-μσ)3]= =E[(Z-μσ)3]
và định nghĩa X nối Y nếu còn lại của μ(μ-Z)nếu không thì. (Không biết ký hiệu chính xác cho việc này, có ai quan tâm giúp đỡ không?)

Phân phối kết quả sẽ không chính thống nếu các tệp PDF của YZ đang gia tăng ở bên trái của μ (ngoài số 0 ở bên phải của μ).


1
Làm thế nào để bạn đảm bảo rằng phân phối là không chính thống?
Dilip Sarwate

Cảm ơn đã chỉ ra điều này. Các tệp PDF củaYZ sẽ phải tăng nghiêm ngặt cho đến khi μ, và sau đó giảm xuống không.
krlmlr

Đây là ý tưởng đúng nhưng nó vẫn cần một số công việc, bởi vì σ có thể thay đổi khi kết hợp YZ.
whuber

@whuber: Chết tiệt. Tôi biết rằng đã có một số cạm bẫy ... :-)
krlmlr

2

Phân phối rời rạc sau đây là không đối xứng và có độ lệch null: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Tôi tìm thấy nó trong bài báo của Doric và cộng sự, Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9


+1 Nó kiểm tra và nó không chính thống. Đó là ví dụ đơn giản nhất có thể.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.