Có một phân phối hình cao nguyên?


30

Tôi đang tìm kiếm một phân phối trong đó mật độ xác suất giảm nhanh sau một thời gian cách xa giá trị trung bình, hoặc theo cách nói của tôi là "phân phối hình cao nguyên".

Một cái gì đó ở giữa Gaussian và đồng phục.


8
Bạn có thể tổng hợp một RV Gaussian và RV đồng phục.
StrongBad

3
Đôi khi người ta nghe về cái gọi là phân phối platykurtic .
JM không phải là một thống kê

Câu trả lời:


53

Bạn có thể đang tìm kiếm phân phối được biết đến dưới tên của bình thường tổng quát (phiên bản 1) , phân phối Subbotin hoặc phân phối năng lượng theo cấp số nhân. Nó được tham số hóa bởi vị trí , scale và shape với pdfσ betaμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

như bạn có thể nhận thấy, với nó giống và hội tụ đến phân phối Laplace, với nó hội tụ về mức bình thường và khi phân phối đồng đều.β = 2 β = β=1β=2β=

nhập mô tả hình ảnh ở đây

Nếu bạn đang tìm kiếm phần mềm đã triển khai, bạn có thể kiểm tra normalpthư viện cho R (Mineo và Ruggieri, 2005). Điều tuyệt vời ở gói này là, trong số những thứ khác, nó thực hiện hồi quy với các lỗi phân phối thông thường, nghĩa là giảm thiểu định mức .Lp


Mineo, AM, & Ruggieri, M. (2005). Một công cụ phần mềm để phân phối năng lượng theo cấp số nhân: Gói normalp. Tạp chí phần mềm thống kê, 12 (4), 1-24.


20

Nhận xét của @ StrongBad là một gợi ý thực sự tốt. Tổng của một RV và gaussian RV thống nhất có thể cung cấp cho bạn chính xác những gì bạn đang tìm kiếm nếu bạn chọn đúng các tham số. Và nó thực sự có một giải pháp dạng đóng hợp lý tốt đẹp.

Pdf của biến này được cho bởi biểu thức:

14a[erf(x+aσ2)erf(xaσ2)]

σa là "bán kính" của RV đồng phục trung bình bằng không. là độ lệch chuẩn của RV gaussian không có nghĩa.σ

Tệp PDF


3
Tham khảo: Bhattacharjee, GP, Pandit, SNN và Mohan, R. 1963. Chuỗi kích thước liên quan đến phân phối lỗi hình chữ nhật và bình thường. Kỹ thuật, 5, 404 mộc406.
Tim

15

Có vô số phân phối "hình cao nguyên".

Bạn có theo đuổi điều gì cụ thể hơn là "ở giữa Gaussian và đồng phục" không? Điều đó hơi mơ hồ.

Đây là một điều dễ dàng: bạn luôn có thể dính một nửa bình thường ở mỗi đầu của đồng phục:

Mật độ với trung tâm đồng nhất và đuôi Gaussian

Bạn có thể kiểm soát "chiều rộng" của đồng phục so với tỷ lệ của bình thường để bạn có thể có các cao nguyên rộng hơn hoặc hẹp hơn, đưa ra cả một lớp phân phối, bao gồm Gaussian và đồng phục làm trường hợp giới hạn.

Mật độ là:

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

trong đóh=11+w/(2πσ)

Vì cho cố định , chúng tôi tiếp cận đồng phục trên và như cho cố định chúng tôi tiếp cận .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

Dưới đây là một số ví dụ (với trong mỗi trường hợp):μ=0

Cốt truyện của nhiều ví dụ khác nhau về bộ đồng phục đuôi Gaussian này

Có lẽ chúng ta có thể gọi mật độ này là "đồng phục đuôi Gaussian".


1
Ach! Tôi thích tham dự các quả bóng chính thức mặc đồng phục đuôi Gausian! ;)
Alexis

7

Xem bản phân phối "Tháp quỷ" của tôi ở đây [1]:

| x | <f(x)=0.3334 , cho ; , với giá ; và , với.|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

Chức năng mật độ tháp của quỷ với đỉnh bằng phẳng, các mặt lồi, bị cắt ở cực trị

Phân phối "váy trơn" thậm chí còn thú vị hơn.

Thật dễ dàng để xây dựng các bản phân phối có bất kỳ hình dạng nào bạn muốn.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Thống kê 68 (3): 191 Từ 195. doi: 10.1080 / 00031305.2014.917055
truy cập công cộng pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Xin chào Peter - Tôi đã tự do đưa ra chức năng và chèn một hình ảnh cũng như đưa ra một tài liệu tham khảo đầy đủ. (Nếu bộ nhớ phục vụ tôi nghĩ Kendall và Stuart đưa ra các chi tiết của một lật tẩy tương tự trong văn bản cổ điển của họ Nếu tôi nhớ chính xác -. Nó đã được một thời gian dài - Tôi tin rằng họ cũng thảo luận rằng nó không phải là nặng-tailedness)
Glen_b -Reinstate Monica

Cảm ơn, Glen_b. Tôi chưa bao giờ nói kurtosis đo những gì các số chỉ số đuôi đo. Thay vào đó, bài viết của tôi chứng minh sự suy yếu là, đối với một lớp phân phối rất rộng, gần bằng với E (Z ^ 4 * I (| Z |> 1)). Do đó, kurtosis rõ ràng không cho bạn biết gì về 'đỉnh', thường được tìm thấy trong phạm vi {Z: | Z | <1}. Thay vào đó, nó được xác định chủ yếu bởi các đuôi. Gọi nó là E (Z ^ 4 * I (| Z |> 1)) nếu thuật ngữ "nặng đuôi" có nghĩa khác.
Peter Westfall

Ngoài ra, @Glen_b bạn đang đề cập đến chỉ mục đuôi nào? Có vô số. Vượt qua đuôi không định nghĩa "đuôi" đúng cách. Theo một số định nghĩa về đuôi của độ nặng đuôi, N (0,1) là "đuôi nặng" hơn 0,9999 * U (-1,1) + .0001 * U (-1000,1000), mặc dù sau này là rõ ràng là đuôi nặng hơn, mặc dù có đuôi hữu hạn. Và, BTW, sau này có mức độ tổn thương cực kỳ cao, không giống như N (0,1).
Peter Westfall

Tôi không thể tìm thấy tôi nói "chỉ số đuôi" ở bất cứ đâu trong bình luận của tôi; Tôi không chắc chắn những gì bạn đang đề cập đến ở đó khi bạn nói "bạn đang đề cập đến chỉ số đuôi nào". Nếu bạn muốn nói một chút về sự nặng nề thì điều tốt nhất nên làm là kiểm tra xem Kendall và Stuart thực sự nói gì; Tôi tin rằng họ thực sự so sánh tỷ lệ mật độ tiệm cận với các biến tiêu chuẩn đối xứng, nhưng có lẽ đó là chức năng sống sót có lẽ; vấn đề là của họ, không phải của tôi
Glen_b -Reinstate Monica

Lạ thật. Chà, trong bất kỳ sự kiện nào, Kendall và Stuart đã hiểu sai. Kurtosis rõ ràng là một thước đo trọng lượng đuôi như định lý của tôi chứng minh.
Peter Westfall

5

Rất nhiều câu trả lời hay. Giải pháp được giới thiệu ở đây có 2 tính năng: (i) rằng nó có dạng chức năng đặc biệt đơn giản và (ii) phân phối kết quả nhất thiết phải tạo ra một pdf hình cao nguyên (không chỉ là trường hợp đặc biệt). Tôi không chắc điều này đã có tên trong tài liệu chưa, nhưng vắng mặt, chúng ta hãy gọi nó là bản phân phối Plateau với pdf :f(x)

f(x)=k11+x2afor xR

Ở đâu:

  • tham số là số nguyên dương vàa
  • k là hằng số tích hợp: k=aπsin(π2a)

Đây là một biểu đồ của pdf, cho các giá trị khác nhau của tham số :a

nhập mô tả hình ảnh ở đây

.

Khi tham số trở nên lớn, mật độ có xu hướng phân phối Đồng nhất (-1,1). Cốt truyện sau đây cũng so sánh với một tiêu chuẩn Bình thường (màu xám nét đứt):a

nhập mô tả hình ảnh ở đây


3

Một số khác ( EDIT : Tôi đã đơn giản hóa nó ngay bây giờ. EDIT2 : Tôi đã đơn giản hóa nó hơn nữa, mặc dù bây giờ hình ảnh không thực sự phản ánh phương trình chính xác này):

f(x)= =13αđăng nhập(cosh(αmột)+cosh(αx)cosh(αb)+cosh(αx))

đăng nhập(cosh(x))x

mộttôiphmộtmột= =2b= =1


Đây là một số mã mẫu trong R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

flà phân phối của chúng tôi. Hãy vẽ nó cho một chuỗix

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Bảng điều khiển đầu ra:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Và cốt truyện:

Phân phối của tôi dựa trên nhật ký cosh

Bạn có thể thay đổi ab, tương ứng khoảng bắt đầu và kết thúc độ dốc, nhưng sau đó sẽ cần chuẩn hóa thêm và tôi đã không tính toán được (đó là lý do tại sao tôi sử dụng a = 2b = 1trong cốt truyện).


2

Nếu bạn đang tìm kiếm một cái gì đó rất đơn giản, với một cao nguyên trung tâm và các cạnh của phân bố tam giác, bạn có thể kết hợp các phân phối tam giác N, N tùy thuộc vào tỷ lệ mong muốn giữa cao nguyên và gốc. Tại sao hình tam giác, bởi vì chức năng lấy mẫu của họ đã tồn tại trong hầu hết các ngôn ngữ. Bạn sắp xếp ngẫu nhiên từ một trong số họ.

Trong R sẽ cung cấp cho:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây


2

Đây là một cái khá hay: sản phẩm của hai hàm logistic.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Điều này có lợi ích của việc không được piecewise.

B điều chỉnh độ rộng và A điều chỉnh độ dốc của điểm rơi. Dưới đây là B = 1: 6 với A = 2. Lưu ý: Tôi đã không dành thời gian để tìm ra cách bình thường hóa điều này.

Phân bố cao nguyên

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.