Phân phối rời rạc này có một tên?


21

Phân phối rời rạc này có một tên? Đối vớii1...N

f(tôi)= =1NΣj= =tôiN1j

Tôi đã xem qua bản phân phối này từ các mục sau: Tôi có một danh sách mục được xếp hạng theo một số chức năng tiện ích. Tôi muốn chọn ngẫu nhiên một trong các mục, thiên về phần đầu của danh sách. Vì vậy, trước tiên tôi chọn một chỉ số giữa 1 và thống nhất. Sau đó tôi chọn một mục giữa các chỉ số 1 và . Tôi tin rằng quá trình này dẫn đến phân phối ở trên.j N jNjNj


2
Đây không phải là một bản phân phối: nó không được chuẩn hóa.
whuber

@whuber Lúc đầu tôi nghĩ vậy (và nhận xét trước khi tôi nhận ra rằng tôi đã hiểu nhầm và xóa nhận xét), nhưng hóa ra tôi đã hiểu nhầm định nghĩa. Trừ khi tôi có một sự hiểu lầm xa hơn, đó là một hàm khối lượng xác suất chuẩn hóa.
Glen_b -Reinstate Monica

4
Nó được bình thường hóa. 1/1 sẽ xuất hiện trong tổng số chính xác một lần (nó sẽ ở f (1)). 1/2 sẽ xuất hiện chính xác hai lần (nó sẽ ở f (1) và f (2)). v.v ... Vậy tổng của tất cả các khoản tiền đó sẽ là N và hằng số chuẩn hóa được hiển thị là 1 / N. kiểm tra ra.
RCorty

1
Mặc dù vậy, tôi không biết bản phân phối này được gọi là gì. Tôi cũng không biết làm thế nào quá trình bạn mô tả dẫn đến bản phân phối này. Một suy nghĩ của tôi là nó có vẻ như là một phiên bản rời rạc của một quá trình phá vỡ thanh, rất dễ bị googlable.
RCorty

@Glen_b Cảm ơn. Tôi đã đọc bài viết này trên điện thoại của tôi, mà không làm cho rõ ràng đủ. f
whuber

Câu trả lời:


30

Bạn có một phiên bản rời rạc của phân phối nhật ký âm, nghĩa là phân phối có hỗ trợ là và có pdf là .f ( t ) = - log t[0,1]f(t)= =-đăng nhậpt

Để thấy điều này, tôi sẽ xác định lại biến ngẫu nhiên của bạn để lấy các giá trị trong tập thay vì và gọi kết quả phân phối . Sau đó, yêu cầu của tôi là{ 0 , 1 , 2 , Hoài , N } T{0,1/N,2/N,Giáo dục,1}{0,1,2,Giáo dục,N}T

Pr(T= =tN)-1Nđăng nhập(tN)

vì trong khi được giữ (xấp xỉ) không đổi. tN,ttN

Đầu tiên, một thí nghiệm mô phỏng nhỏ chứng minh sự hội tụ này. Đây là một triển khai nhỏ của bộ lấy mẫu từ bản phân phối của bạn:

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

Đây là biểu đồ của một mẫu lớn được lấy từ bản phân phối của bạn:

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

nhập mô tả hình ảnh ở đây

và đây là pdf logarit:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

nhập mô tả hình ảnh ở đây

Để xem tại sao sự hội tụ này xảy ra, hãy bắt đầu với biểu thức của bạn

Pr(T= =tN)= =1NΣj= =tN1j

và nhân và chia choN

Pr(T= =tN)= =1NΣj= =tNNj1N

Tổng cộng bây giờ là tổng Riemann cho hàm , được tích hợp từ đến . Đó là, đối với lớn , tg(x)= =1x 1NtN1N

Pr(T= =tN)1NtN11xdx= =-1Nđăng nhập(tN)

đó là biểu hiện tôi muốn đến


Bạn đang vô cùng hoan nghênh. Đây là một câu hỏi hay và tôi đã có rất nhiều niềm vui khi giải quyết nó.
Matthew Drury

6

Điều này dường như có liên quan đến phân phối Whitworth. (Tôi không tin đó là phân phối Whitworth, vì nếu tôi nhớ đúng, đó là phân phối của một tập hợp các giá trị được đặt hàng, nhưng dường như nó được kết nối với nó và dựa trên cùng một sơ đồ tổng hợp.)

Có một số cuộc thảo luận về Whitworth (và nhiều tài liệu tham khảo) trong

Anthony Lawrance và Robert Marks, (2008)
"Phân phối quy mô doanh nghiệp trong một ngành có nguồn lực hạn chế" ,
Kinh tế học ứng dụng , tập. 40, số 12, trang 1595-1607

(Dường như có một phiên bản giấy làm việc ở đây )

Cũng thấy

Nancy L Geller, (1979)
Một thử nghiệm về tầm quan trọng đối với bản phân phối Whitworth,
Tạp chí của Hiệp hội Khoa học Thông tin Hoa Kỳ , số 30 (4), tr.229-231


2
Để làm cho câu trả lời này được khép kín, bạn có thể đưa ra định nghĩa về phân phối Whitworth và có thể cung cấp một vài lời giải thích liên quan đến kết nối mà bạn thấy không?
whuber

@whuber Vâng, nó nên là một bình luận khi nó đứng. Tôi sẽ chỉnh sửa một số chi tiết nhưng nó sẽ kết thúc lâu hơn nữa.
Glen_b -Reinstate Monica

Chỉ cần một số loại định nghĩa sẽ tốt.
whuber

Cảm ơn, điều đó đã được hiểu, nhưng tuy nhiên đó sẽ là kết quả.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.