Phân phối trên danh sách được sắp xếp


10

Nói rằng chúng tôi có một danh sách các mặt hàng

[a, b, c, ... x, y, z, ...]

Tôi đang tìm kiếm một gia đình phân phối với sự hỗ trợ trong danh sách trên được điều chỉnh bởi một số tham số alpha để:

  • Với alpha = 0, nó gán xác suất 1 cho mục đầu tiên, ở trên và 0 cho phần còn lại. Đó là, nếu chúng tôi lấy mẫu từ danh sách này, với sự thay thế, chúng tôi luôn nhận được a.
  • Khi alpha tăng, chúng tôi gán xác suất cao hơn và cao hơn cho phần còn lại của danh sách, tôn trọng thứ tự của danh sách, sau ~ phân rã theo cấp số nhân.
  • Khi alpha = 1, chúng tôi chỉ định xác suất bằng nhau cho tất cả các mục trong danh sách, vì vậy việc lấy mẫu từ danh sách gần giống với việc bỏ qua thứ tự của nó.

Điều này rất giống với phân phối hình học, nhưng có một số khác biệt đáng chú ý:

  • Phân phối phân phối hình học được xác định trên tất cả các số tự nhiên. Trong trường hợp của tôi ở trên, danh sách có kích thước cố định.
  • Phân phối hình học không được xác định cho alpha = 0.

1
Bạn xuất hiện để mô tả một gia đình phân phối hình học cắt ngắn. Tuy nhiên, có vô cùng nhiều gia đình mà chất lượng hoạt động giống như mô tả của bạn. Sau đó, nhiều hơn sẽ là để giải thích những gì bạn muốn sử dụng một gia đình như vậy cho.
whuber

Cảm ơn @whuber Có, tôi hiểu có vô số bản phân phối phù hợp với mô tả này. Bất kỳ cụ thể mà đến với tâm trí? Tôi có một hệ thống hiện đang chọn yếu tố đầu tiên của danh sách này (đại diện cho điểm số), nhưng tôi muốn chọn ngẫu nhiên lựa chọn này (và tham số hóa ngẫu nhiên này). Tôi không tìm kiếm một loại "phân rã" cụ thể dựa trên alpha. Miễn là alpha = 0 không biểu thị ngẫu nhiên, tức là chọn phần tử đầu tiên, 1 đại diện cho "chọn bất kỳ phần tử nào" và bảng chữ cái trong khoảng từ 0 đến 1 đại diện cho "một cái gì đó ở giữa" hai chữ cái này, nó sẽ đủ tốt.
Amelio Vazquez-Reina

Câu trả lời:


11

Giả sử , thứ hạng của phần tử danh sách , có giá trị trong cho danh sách có phần tử (các mối quan hệ có thể bị phá vỡ ngẫu nhiên). Sau đó, chúng ta có thể xác định xác suất chọn là:rii{0,1,,n1}ni

pi=αrik=1nαrk

Đây là về cơ bản chỉ là một cắt ngắn phân phối hình học bình thường hóa một cách thích hợp, và nó cũng là liên quan đến các chức năng softmax . Trong trường hợp đặc biệt của , hãy sử dụng quy ước . Lưu ý rằng mẫu số luôn có thể được viết dưới dạng biểu thức đóng đơn giản. Đối với nó nhận giá trị và đối với nó nhận giá trị .α=000=1α<11αn1αα=1n

Với , rõ ràng điều này chỉ gán xác suất bằng nhau cho mỗi phần tử. Là , cách tiếp cận này cung cấp tất cả khối lượng xác suất cho phần tử đầu tiên.α=1α0

Trong danh sách có 10 phần tử, mức giảm theo cấp số nhân mà bạn yêu cầu rõ ràng với :α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

Các sơ đồ sau đây xác suất của phần tử đầu tiên được chọn thay đổi dựa trên , sử dụng danh sách có độ dài 10.α

nhập mô tả hình ảnh ở đây


Đẹp. Đây là cách thông minh hơn tôi có thể hy vọng được.
Matthew Drury

@Matthew Đây là các bản phân phối hình học rút gọn mà tôi đã đề cập trước đó.
whuber

4

Tôi sẽ cố gắng xây dựng một ví dụ từ các nguyên tắc đầu tiên.

Hãy lấy ba bản phân phối làm các khối xây dựng của chúng tôi:

  • P là phân phối gán xác suất một cho phần tử đầu tiên của danh sách, bằng không cho tất cả các phần tử khác.
  • E là xác suất gán phân phối cho phần tử đầu tiên của danh sách, cho phần tiếp theo, v.v. Vì danh sách là hữu hạn, chúng sẽ không tổng bằng , nhưng chúng ta có thể chuẩn hóa để có phân phối xác suất.12141
  • U là phân phối thống nhất trong danh sách.

Bây giờ chúng tôi muốn có một họ một tham số kết hợp lồi tích cực của các phân phối này

α(t)P+β(t)E+γ(t)U

trong đó cho tất cả , với thuộc tính bổ sung đó là và . α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

Về mặt hình học, chúng tôi muốn tìm ra một đường cong trong tam giác đều nằm giữa các điểm bắt đầu ở góc đầu tiên, và kết thúc và cuối cùng. Ngoài ra, vì chúng tôi muốn phân phối trông "theo cấp số nhân" trong thời gian giữa, chúng tôi muốn đường cong chiếm phần bên trong của tam giác tại các thời điểm .(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

Đây là một tùy chọn cho đường cong:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

Tôi đã xây dựng công trình này ngược từ các thuộc tính chúng ta muốn. Đường cong chạy dọc theo cạnh của tam giác giữa đỉnh bắt đầu và kết thúc. Phần còn lại của công thức chỉ là tổng lồi của đường cong cạnh này và điểm duy nhất , sẽ đẩy đường cong dọc theo cạnh vào bên trong tại thời điểm .( 1(1t,0,t)t(0,1)(13,13,13)t(0,1)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.