Làm thế nào tôi có thể phân tích chứng minh rằng việc chia ngẫu nhiên một số tiền dẫn đến phân phối theo cấp số nhân (ví dụ: thu nhập và sự giàu có)?


36

Trong bài viết hiện tại về KHOA HỌC, những điều sau đây đang được đề xuất:

Giả sử bạn chia ngẫu nhiên 500 triệu thu nhập cho 10.000 người. Chỉ có một cách để cung cấp cho mọi người một phần bằng nhau, 50.000 chia sẻ. Vì vậy, nếu bạn giảm bớt thu nhập một cách ngẫu nhiên, sự bình đẳng là cực kỳ khó xảy ra. Nhưng có vô số cách để cho một vài người nhiều tiền mặt và nhiều người một ít hoặc không có gì. Trên thực tế, với tất cả các cách bạn có thể phân chia thu nhập, hầu hết chúng đều tạo ra sự phân phối thu nhập theo cấp số nhân.

Tôi đã thực hiện điều này với mã R sau đây dường như để xác nhận lại kết quả:

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45, xlim = c(0, quantile(d, 0.99)))

fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", pch=16, add = TRUE)

nhập mô tả hình ảnh ở đây

Câu hỏi của tôi
Làm thế nào tôi có thể phân tích chứng minh rằng phân phối kết quả là thực sự theo cấp số nhân?

Phụ lục
Cảm ơn bạn đã trả lời và ý kiến ​​của bạn. Tôi đã suy nghĩ về vấn đề và đưa ra lý luận trực quan sau đây. Về cơ bản những điều sau đây xảy ra (Cẩn thận: quá mức trước mắt): Bạn loại đi theo số tiền và ném một đồng xu (thiên vị). Mỗi khi bạn nhận được ví dụ như người đứng đầu bạn chia số tiền. Bạn phân phối các phân vùng kết quả. Trong trường hợp riêng biệt, việc tung đồng xu tuân theo phân phối nhị thức, các phân vùng được phân phối hình học. Các chất tương tự liên tục là phân phối poisson và phân phối theo cấp số nhân tương ứng! (Với lý do tương tự, nó cũng trở nên rõ ràng bằng trực giác tại sao phân phối hình học và phân phối theo cấp số nhân có đặc tính của bộ nhớ - bởi vì đồng xu cũng không có bộ nhớ).


3
Nếu bạn đưa tiền ra từng cái một, có nhiều cách để phân phối chúng đồng đều và nhiều cách khác để phân phối chúng gần như đều nhau (ví dụ: phân phối gần như bình thường và có giá trị trung bình là và độ lệch chuẩn gần bằng )22450000224
Henry

@Henry: Bạn có thể vui lòng mô tả thủ tục này thêm một chút nữa không. Đặc biệt ý của bạn là "từng cái một" là gì? Có lẽ bạn thậm chí có thể cung cấp mã của bạn. Cảm ơn bạn.
vonjd

vonjd: Bắt đầu với 500 triệu xu. Phân bổ từng đồng tiền một cách độc lập và ngẫu nhiên giữa 10 nghìn cá nhân với xác suất như nhau. Thêm bao nhiêu tiền mỗi cá nhân nhận được.
Henry

@Henry: Tuyên bố ban đầu là hầu hết các cách phân phối tiền mặt mang lại phân phối theo cấp số nhân. Các cách phân phối tiền mặt và các cách phân phối tiền không phải là đẳng cấu, vì chỉ có một cách để phân phối đồng đều 500.000.000 đô la trong số 10.000 người (cho mỗi 50.000 đô la) nhưng có 500.000.000! ((50.000!) ^ 10.000) phân phối 50.000 xu cho mỗi 10.000 người.
supercat

1
@Henry Trong kịch bản bạn mô tả trong phần bình luận cao nhất, nó được đặt từ đầu rằng mỗi người có xác suất nhận được đồng xu bằng nhau. Điều kiện này có hiệu quả gán một trọng lượng rất lớn cho phân phối bình thường, thay vì xem xét các cách khác nhau để phân phối tiền.
higgsss

Câu trả lời:


27

Để làm cho vấn đề đơn giản hơn, hãy xem xét trường hợp các giá trị được phép chia sẻ của mỗi người là riêng biệt, ví dụ: số nguyên. Tương tự, người ta cũng có thể tưởng tượng phân vùng "trục thu nhập" thành các khoảng cách đều nhau và xấp xỉ tất cả các giá trị rơi vào một khoảng nhất định theo điểm giữa.

Biểu thị tổng thu nhập là , giá trị cho phép thứ sx s , tổng số người là N và cuối cùng, số người có cổ phần của x sn s , cần thỏa mãn các điều kiện sau: C 1 ( { n s } ) Σ s n s - N = 0 ,C 2 ( { n s } ) Σ s n sXsxsNxsns

C1({ns})snsN=0,
C2({ns})snsxsX=0.

Lưu ý rằng nhiều cách khác nhau để chia chia sẻ có thể đại diện cho cùng một phân phối. Ví dụ: nếu chúng tôi xem xét chia 4 đô la cho hai người, đưa 3 đô la cho Alice và 1 đô la cho Bob và ngược lại cả hai sẽ phân phối giống hệt nhau. Vì sự phân chia là ngẫu nhiên, việc phân phối với số lượng tối đa các cách tương ứng để phân chia cổ phần có cơ hội tốt nhất để xảy ra.

Để có được phân phối như vậy, người ta phải tối đa hóa theo hai ràng buộc được đưa ra ở trên. Phương pháp nhân số Lagrange là một cách tiếp cận chính tắc cho việc này. Hơn nữa, người ta có thể chọn làm việc vớilnWthay vìchínhW, vì "ln" là một hàm tăng đơn điệu. Đó là, lnW

W({ns})N!sns!,
lnWWln nơiλ1,2là Lagrange nhân. Lưu ý rằng theocông thức của Stirling, lnn! nlnn-n, dẫn đến dlnn!
lnWns=λ1C1ns+λ2C1ns=λ1+λ2xs,
λ1,2
lnn!nlnnn,
Do đó, lnW
dlnn!dnlnn.
Sau đó nó sau đó nsexp(-λ1-λ2xs), mà là một phân phối mũ. Người ta có thể có được các giá trị của số nhân Lagrange bằng cách sử dụng các ràng buộc. Từ ràng buộc đầu tiên, N
lnWnslnns.
nSđiểm kinh nghiệm(-λ1-λ2xS),
nơiΔxlà khoảng cách giữa các giá trị cho phép. Tương tự, X
N= =ΣSnSΣSđiểm kinh nghiệm(-λ1-λ2xS)1Δx0điểm kinh nghiệm(-λ1-λ2x)dx= =1λ2Δxđiểm kinh nghiệm(-λ1),
Δx Do đó, chúng tôi có exp(-λ1)=N2Δx
X= =ΣSnSxSΣSxSđiểm kinh nghiệm(-λ1-λ2xS)1Δx0xđiểm kinh nghiệm(-λ1-λ2x)dx= =1λ22Δxđiểm kinh nghiệm(-λ1).
λ2=N
điểm kinh nghiệm(-λ1)= =N2ΔxX,
Rằng đây thực sự là một tối đa, chứ không phải ở mức tối thiểu hoặc một điểm yên ngựa, có thể được nhìn thấy từ Hessian củalnW-λ1C1-λ2C2. Bởi vìC1,2là tuyến tính trongns, nó cũng giống như củalnW: 2 lnW
λ2= =NX.
lnW-λ1C1-λ2C2C1,2nSlnW2lnW
2lnWnS2= =-1nS<0,
Do đó, Hessian là lõm, và những gì chúng tôi đã tìm thấy thực sự là tối đa.
2lnWnSnr= =0(Sr).

W({ns})W({ns})ns1ns

N1023


1
Cảm ơn bạn, xin hãy xem câu trả lời của Glen_b. Điều này có phù hợp với câu trả lời của bạn không?
vonjd

2
@vonjd Bạn được chào đón! Tôi nghĩ rằng câu trả lời của anh ấy phù hợp với tôi. Đối với tôi, dường như anh ta đang tạo ra sự tương đồng với quy trình Poisson theo nghĩa sau: Hãy xem xét một quy trình Poisson với "khoảng thời gian trung bình" là 50.000 và đếm 10.000 sự kiện. Sau đó, trung bình, "tổng khoảng thời gian" là 50.000 x 10.000 = 500 triệu.
higgsss

2
@vonjd Tôi cập nhật câu trả lời của tôi. Đáng chú ý nhất, tôi đã thêm các cuộc thảo luận về điều kiện phân phối mà chúng ta thường quan sát là một cái gì đó gần với phân phối có thể xảy ra nhất.
higgsss

2
Khi xem xét các trường hợp riêng biệt, sẽ hữu ích khi quan sát rằng mọi thứ T có thể được chia cho N người ((N + T-1) chọn cách (N-1))? Nếu người đầu tiên nhận được f thứ, số cách người ta có thể phân phối phần còn lại là ((N + Tf-2) chọn (N-2)); tổng của giá trị f từ 0 đến N là tổng số cách phân phối mọi thứ.
supercat

1
T»N,ff(N+T-f-2)(N-2)= =(N+T-f-2)!/(N-2)!/(T-f)! α(N+T-f-2)!/(T-f)!(T-f)N-2TN-2e-(N-2)f/T

17

Trong thực tế, bạn có thể chứng minh rằng nó không thực sự theo cấp số nhân, gần như tầm thường:

500500

Tuy nhiên, không quá khó để thấy rằng đối với ví dụ về khoảng cách đồng nhất của bạn rằng nó phải gần với cấp số nhân.

Hãy xem xét một quá trình Poisson - nơi các sự kiện xảy ra ngẫu nhiên dọc theo một số chiều. Số lượng sự kiện trên một đơn vị của khoảng có phân phối Poisson và khoảng cách giữa các sự kiện là theo cấp số nhân.

Nếu bạn có một khoảng thời gian cố định thì các sự kiện trong quy trình Poisson nằm trong nó được phân phối đồng đều trong khoảng đó. Xem tại đây .

[Tuy nhiên, lưu ý rằng vì khoảng thời gian là hữu hạn, bạn chỉ đơn giản là không thể quan sát các khoảng trống lớn hơn độ dài khoảng thời gian và khoảng cách lớn gần như vậy sẽ không thể xảy ra (ví dụ, trong khoảng thời gian đơn vị - nếu bạn thấy các khoảng trống 0,04 và 0,01, khoảng cách tiếp theo bạn thấy không thể lớn hơn 0,95).]

n

nn+1n

Cụ thể hơn, bất kỳ khoảng cách nào bắt đầu trong khoảng thời gian được đặt trong quá trình Poisson đều có cơ hội được "kiểm duyệt" (có hiệu quả, được cắt ngắn hơn so với trước đây) bằng cách chạy vào cuối khoảng.

nhập mô tả hình ảnh ở đây

Các khoảng trống dài hơn có nhiều khả năng làm điều đó hơn các khoảng trống ngắn hơn và nhiều khoảng trống trong khoảng có nghĩa là độ dài khoảng cách trung bình phải giảm xuống - nhiều khoảng trống ngắn hơn. Xu hướng bị "cắt đứt" này sẽ có xu hướng ảnh hưởng đến việc phân phối các khoảng trống dài hơn các khoảng cách ngắn (và không có bất kỳ khoảng cách nào giới hạn trong khoảng sẽ vượt quá độ dài của khoảng - vì vậy phân phối kích thước khoảng cách sẽ giảm một cách trơn tru bằng không tại kích thước của toàn bộ khoảng thời gian).

Trong sơ đồ, một khoảng thời gian dài ở cuối đã được cắt ngắn hơn và một khoảng thời gian tương đối ngắn hơn khi bắt đầu cũng ngắn hơn. Những ảnh hưởng thiên vị chúng ta đi từ cấp số nhân.

n

n

Đây là một mô phỏng phân phối các khoảng trống cho n = 2:

nhập mô tả hình ảnh ở đây

Không theo cấp số nhân.

n1n+1

nhập mô tả hình ảnh ở đây

điểm kinh nghiệm(-21x)

nhập mô tả hình ảnh ở đây

n= =10000


2
Vì vậy, chỉ để hiểu chính xác bạn: Bạn đang nói rằng nó không theo cấp số nhân?!? higgsss chứng minh ở trên rằng nó là cấp số nhân!
vonjd

3
Hãy để tôi trích dẫn câu trả lời của mình: (i) "bạn có thể chứng minh rằng nó không thực sự theo cấp số nhân" NHƯNG (ii) cho các khoảng trống đồng phục mà bạn đã xem "... nó phải gần với số mũ" ... "miễn là không quá nhỏ." ... Điều gì không rõ ràng?
Glen_b -Reinstate Monica

5
nSđiểm kinh nghiệm(-λ1-λ2xS)

2
Tôi nghĩ rằng câu trả lời này là một cách tuyệt vời để xem xét vấn đề, và xứng đáng nhận được nhiều sự ủng hộ hơn. Tuy nhiên, tôi e rằng cách tương tự với quá trình Poisson hoạt động (ví dụ: "thời gian" tương ứng với cái gì) có thể không rõ ràng. Bạn có sẵn sàng cung cấp thêm một số chi tiết?
higgsss

3
@higgsss Tôi đã điều chỉnh lại một chút (xóa tham chiếu theo thời gian), thêm một chút chi tiết và liên kết. Tôi có thể thêm một số thảo luận sau. Nếu bạn có bất kỳ đề xuất cụ thể nào, tôi sẽ quan tâm đến việc cải thiện câu trả lời của tôi hơn nữa.
Glen_b -Reinstate Monica

8

Giả sử tiền là vô hạn để chúng ta có thể giao dịch với số thực chứ không phải số nguyên.

t= =500000000n= =10000

p(x)= =n-1t(1-xt)n-2
0xt
P(Xx)= =1-(1-xt)n-1.

Xtt-Xnn-1n= =2n= =1

nnt(1-ym)mđiểm kinh nghiệm(-y)m


8

Có thể nói, "giả sử bạn chia ngẫu nhiên 500 triệu thu nhập cho 10.000 người" không đủ cụ thể để trả lời câu hỏi. Có nhiều quy trình ngẫu nhiên khác nhau có thể được sử dụng để phân bổ một lượng tiền cố định cho một số người cố định và mỗi người sẽ có những đặc điểm riêng cho phân phối kết quả. Dưới đây là ba quy trình phát sinh mà tôi có thể nghĩ ra và sự phân phối của cải mà mỗi người tạo ra.

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

Phương pháp 1, được đăng bởi OP:

Chọn các số 'p' từ [0, w) một cách ngẫu nhiên. Sắp xếp chúng. Nối '0' lên phía trước. Phát hành số tiền đô la đại diện bởi sự khác biệt giữa các yếu tố liên tiếp trong danh sách này.

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45,
     xlim = c(0, quantile(d, 0.99)))
fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", 
      pch=16, add = TRUE)

khoảng nghỉ thống nhất

Cách 2:

Chọn số 'p' từ [0, w) một cách ngẫu nhiên. Hãy xem xét các 'trọng số' này, vì vậy 'w' không thực sự quan trọng ở giai đoạn này. Bình thường hóa các trọng lượng. Phát số tiền đô la được biểu thị bằng tỷ lệ 'w' tương ứng với mỗi trọng lượng.

d <- runif(p,max=w) #weigh-distribution
d <- d/sum(d)*w #wealth-distribution
h <- hist(d, col="red", main="pretty uniform", freq = FALSE, breaks = 45, 
          xlim = c(0, quantile(d, 0.99)))

trọng lượng thay đổi

Cách 3:

Bắt đầu với 'p' 0s. w lần, thêm 1 vào một trong số chúng, được chọn ngẫu nhiên.

d <- rep(0, p)
for( i in 1:5000000){ ## for-loops in R are terrible, but this gives the idea.
    k <- floor(runif(1, max=p)) + 1    
    d[k] = (d[k] + 1)
}
h <- hist(d, col="red", main="kinda normalish?", freq = FALSE, breaks = 45,
          xlim = c(0, quantile(d, 0.99)))

đô la lặp


4

Hãy để tôi thêm một cái gì đó liên quan đến phụ lục của bạn.

p(x)= =N-1X(1-xX)N-2,
NX

Mm

p(m)= =N-1M+1Πj= =0N-3(1-mM-j)N-2.
M»NN

N

Tuy nhiên, việc thực hiện phân tích lỗi dường như không đơn giản vì các cách lấy mẫu khác nhau trong trường hợp này không độc lập. Họ phải tổng hợp tổng số tiền và số tiền mà người thứ nhất nhận được ảnh hưởng đến phân phối xác suất cho người thứ hai, v.v.

Câu trả lời trước của tôi không gặp phải vấn đề này, nhưng tôi nghĩ sẽ hữu ích khi xem cách giải quyết vấn đề này trong phương pháp này.


3

Phân tích lý thuyết tốt được thực hiện bởi các câu trả lời nâng cao. Tuy nhiên, đây là quan điểm đơn giản, theo kinh nghiệm của tôi về lý do phân phối theo cấp số nhân.

Khi bạn phân phối tiền ngẫu nhiên , hãy xem xét bạn làm từng việc một. Gọi S là tổng ban đầu.

Đối với người đàn ông đầu tiên, bạn phải chọn một số tiền ngẫu nhiên trong khoảng từ 0 đến S. Do đó, trung bình, bạn sẽ chọn S / 2 và duy trì với S / 2.

Đối với người đàn ông thứ hai, bạn sẽ chọn ngẫu nhiên giữa 0 và, trung bình, S / 2. Do đó, trung bình, bạn sẽ chọn S / 4 và duy trì với S / 4.

Vì vậy, về cơ bản, bạn sẽ chia số tiền một nửa mỗi lần (nói theo thống kê).

Mặc dù trong một ví dụ thực tế, bạn sẽ không liên tục giảm một nửa giá trị, nhưng điều này cho thấy lý do tại sao người ta nên kỳ vọng phân phối là theo cấp số nhân.


3
Thuật toán của bạn hàng chục để cung cấp nhiều tiền hơn cho người đầu tiên hơn bất kỳ ai khác. Có những cách tiếp cận khác không có sự thiên vị này.
Henry

@Henry Làm thế nào khác bạn sẽ bắt đầu chia sẻ tiền? Bạn phải bắt đầu với một ai đó. Và khi bạn làm, bạn có toàn bộ số tiền trước mặt bạn. Cho anh ta một phần ngẫu nhiên theo nghĩa đen có nghĩa là chọn ngẫu nhiên từ toàn bộ số tiền. Người ta không thể nói rằng giả định có "người đàn ông đầu tiên" là sai, bởi vì nếu không, người chia sẻ tiền sẽ chỉ chia số tiền cho số người đàn ông vì anh ta biết trước có bao nhiêu người. Đó chỉ là quan điểm của tôi: khi bạn nói rằng bạn chia tiền "ngẫu nhiên", đơn giản là sẽ có một người đàn ông nhận được nhiều tiền hơn
Bogdan Alexandru

Bogdan Alexandru: Thuật toán của tôi (một câu trả lời khác) có đặc điểm là phân phối cho mỗi cá nhân là như nhau cho dù chúng được chọn trước, ở giữa hay cuối. Nó cũng tương ứng với mật độ đồng đều trên không gian bị hạn chế bởi tổng số tiền được phân bổ.
Henry
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.