Tôi đang tìm kiếm một phân phối trong đó mật độ xác suất giảm nhanh sau một thời gian cách xa giá trị trung bình, hoặc theo cách nói của tôi là "phân phối hình cao nguyên".
Một cái gì đó ở giữa Gaussian và đồng phục.
Tôi đang tìm kiếm một phân phối trong đó mật độ xác suất giảm nhanh sau một thời gian cách xa giá trị trung bình, hoặc theo cách nói của tôi là "phân phối hình cao nguyên".
Một cái gì đó ở giữa Gaussian và đồng phục.
Câu trả lời:
Bạn có thể đang tìm kiếm phân phối được biết đến dưới tên của bình thường tổng quát (phiên bản 1) , phân phối Subbotin hoặc phân phối năng lượng theo cấp số nhân. Nó được tham số hóa bởi vị trí , scale và shape với pdfσ beta
như bạn có thể nhận thấy, với nó giống và hội tụ đến phân phối Laplace, với nó hội tụ về mức bình thường và khi phân phối đồng đều.β = 2 β = ∞
Nếu bạn đang tìm kiếm phần mềm đã triển khai, bạn có thể kiểm tra normalp
thư viện cho R (Mineo và Ruggieri, 2005). Điều tuyệt vời ở gói này là, trong số những thứ khác, nó thực hiện hồi quy với các lỗi phân phối thông thường, nghĩa là giảm thiểu định mức .
Mineo, AM, & Ruggieri, M. (2005). Một công cụ phần mềm để phân phối năng lượng theo cấp số nhân: Gói normalp. Tạp chí phần mềm thống kê, 12 (4), 1-24.
Nhận xét của @ StrongBad là một gợi ý thực sự tốt. Tổng của một RV và gaussian RV thống nhất có thể cung cấp cho bạn chính xác những gì bạn đang tìm kiếm nếu bạn chọn đúng các tham số. Và nó thực sự có một giải pháp dạng đóng hợp lý tốt đẹp.
Pdf của biến này được cho bởi biểu thức:
σ là "bán kính" của RV đồng phục trung bình bằng không. là độ lệch chuẩn của RV gaussian không có nghĩa.
Có vô số phân phối "hình cao nguyên".
Bạn có theo đuổi điều gì cụ thể hơn là "ở giữa Gaussian và đồng phục" không? Điều đó hơi mơ hồ.
Đây là một điều dễ dàng: bạn luôn có thể dính một nửa bình thường ở mỗi đầu của đồng phục:
Bạn có thể kiểm soát "chiều rộng" của đồng phục so với tỷ lệ của bình thường để bạn có thể có các cao nguyên rộng hơn hoặc hẹp hơn, đưa ra cả một lớp phân phối, bao gồm Gaussian và đồng phục làm trường hợp giới hạn.
Mật độ là:
trong đó
Vì cho cố định , chúng tôi tiếp cận đồng phục trên và như cho cố định chúng tôi tiếp cận .
Dưới đây là một số ví dụ (với trong mỗi trường hợp):
Có lẽ chúng ta có thể gọi mật độ này là "đồng phục đuôi Gaussian".
Xem bản phân phối "Tháp quỷ" của tôi ở đây [1]:
| x | < , cho ; , với giá ; và , với.
Phân phối "váy trơn" thậm chí còn thú vị hơn.
Thật dễ dàng để xây dựng các bản phân phối có bất kỳ hình dạng nào bạn muốn.
[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Thống kê 68 (3): 191 Từ 195. doi: 10.1080 / 00031305.2014.917055
truy cập công cộng pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf
Rất nhiều câu trả lời hay. Giải pháp được giới thiệu ở đây có 2 tính năng: (i) rằng nó có dạng chức năng đặc biệt đơn giản và (ii) phân phối kết quả nhất thiết phải tạo ra một pdf hình cao nguyên (không chỉ là trường hợp đặc biệt). Tôi không chắc điều này đã có tên trong tài liệu chưa, nhưng vắng mặt, chúng ta hãy gọi nó là bản phân phối Plateau với pdf :
Ở đâu:
Đây là một biểu đồ của pdf, cho các giá trị khác nhau của tham số :
.
Khi tham số trở nên lớn, mật độ có xu hướng phân phối Đồng nhất (-1,1). Cốt truyện sau đây cũng so sánh với một tiêu chuẩn Bình thường (màu xám nét đứt):
Một số khác ( EDIT : Tôi đã đơn giản hóa nó ngay bây giờ. EDIT2 : Tôi đã đơn giản hóa nó hơn nữa, mặc dù bây giờ hình ảnh không thực sự phản ánh phương trình chính xác này):
Đây là một số mã mẫu trong R:
f = function(x, a, b, alpha){
y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
y = y/pi/alpha/6
return(y)
}
f
là phân phối của chúng tôi. Hãy vẽ nó cho một chuỗix
plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)
for(i in 1:10){
y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)
Bảng điều khiển đầu ra:
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"
Và cốt truyện:
Bạn có thể thay đổi a
và b
, tương ứng khoảng bắt đầu và kết thúc độ dốc, nhưng sau đó sẽ cần chuẩn hóa thêm và tôi đã không tính toán được (đó là lý do tại sao tôi sử dụng a = 2
và b = 1
trong cốt truyện).
Nếu bạn đang tìm kiếm một cái gì đó rất đơn giản, với một cao nguyên trung tâm và các cạnh của phân bố tam giác, bạn có thể kết hợp các phân phối tam giác N, N tùy thuộc vào tỷ lệ mong muốn giữa cao nguyên và gốc. Tại sao hình tam giác, bởi vì chức năng lấy mẫu của họ đã tồn tại trong hầu hết các ngôn ngữ. Bạn sắp xếp ngẫu nhiên từ một trong số họ.
Trong R sẽ cung cấp cho:
library(triangle)
rplateau = function(n=1){
replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)
Đây là một cái khá hay: sản phẩm của hai hàm logistic.
(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))
Điều này có lợi ích của việc không được piecewise.
B điều chỉnh độ rộng và A điều chỉnh độ dốc của điểm rơi. Dưới đây là B = 1: 6 với A = 2. Lưu ý: Tôi đã không dành thời gian để tìm ra cách bình thường hóa điều này.