K thành công trong các thử nghiệm Bernoulli, hoặc thử nghiệm phim George Lucas


23

Tôi đang đọc "The Drunkard's Walk" và không thể hiểu một câu chuyện từ nó.

Nó đi từ đây:

Hãy tưởng tượng rằng George Lucas làm một bộ phim Chiến tranh giữa các vì sao mới và trong một thị trường thử nghiệm quyết định thực hiện một thử nghiệm điên rồ. Anh phát hành bộ phim giống hệt nhau dưới hai tựa: "Chiến tranh giữa các vì sao: Tập A" và "Chiến tranh giữa các vì sao: Tập B". Mỗi bộ phim có chiến dịch tiếp thị và lịch phân phối riêng, với các chi tiết tương ứng giống hệt nhau ngoại trừ các đoạn giới thiệu và quảng cáo cho một bộ phim có nội dung "Tập A" và các bộ phim khác, "Tập B".

Bây giờ chúng tôi thực hiện một cuộc thi từ nó. Bộ phim nào sẽ phổ biến hơn? Giả sử chúng tôi xem 20.000 khán giả xem phim đầu tiên và ghi lại bộ phim họ chọn để xem (bỏ qua những người hâm mộ khó tính sẽ đến cả hai và sau đó khẳng định có sự khác biệt tinh tế nhưng có ý nghĩa giữa hai người). Vì các bộ phim và các chiến dịch tiếp thị của chúng giống hệt nhau, chúng tôi có thể mô hình hóa trò chơi theo cách này: Tưởng tượng xếp hàng tất cả người xem liên tiếp và lần lượt lật một đồng xu cho mỗi người xem. Nếu đồng xu ngẩng lên, anh ta hoặc cô ta thấy Tập A; Nếu đồng xu chạm đuôi, đó là Tập B. Bởi vì đồng xu có cơ hội phát triển ngang nhau, bạn có thể nghĩ rằng trong cuộc chiến phòng vé thử nghiệm này, mỗi bộ phim sẽ dẫn đầu khoảng một nửa thời gian.

Nhưng toán học về tính ngẫu nhiên lại nói khác: số lượng thay đổi có thể xảy ra nhất trong vai chính là 0, và có khả năng cao gấp 88 lần rằng một trong hai bộ phim sẽ dẫn đầu qua tất cả 20.000 khách hàng so với điều đó, nói rằng, vai chính liên tục bập bênh "

Tôi, có lẽ không chính xác, gán điều này cho một vấn đề thử nghiệm Bernoulli đơn giản, và phải nói rằng tôi không biết tại sao nhà lãnh đạo sẽ không bập bênh trung bình! Bất cứ ai có thể giải thích?

Câu trả lời:


22

Dưới đây là một số mã R để mô phỏng thí nghiệm của George Lucas:

B<-20000
steps<-2*rbinom(B,1,0.5)-1
rw<-cumsum(steps)
ts.plot(rw,xlab="Number of customers",ylab="Difference")

Chạy nó, chúng ta có được những hình ảnh như sau:

nhập mô tả hình ảnh ở đây

trong đó chênh lệch về vé bán giữa A và B nằm trên trục y.

Tiếp theo, chúng tôi chạy thí nghiệm mô phỏng George Lucas như vậy. Đối với mỗi thử nghiệm, chúng tôi tính tỷ lệ thời gian đã sử dụng , tức là tỷ lệ người xem xếp hàng mà số lượng vé được bán cho A lớn hơn hoặc bằng số lượng vé được bán cho B. Theo trực giác, bạn ' d nói rằng tỷ lệ này nên khoảng . Dưới đây là biểu đồ kết quả:0 1 / 210,00001/2

nhập mô tả hình ảnh ở đây

Tỷ lệ trung bình là theo nghĩa là giá trị mong đợi là , nhưng là giá trị không thể so với các giá trị gần bằng hoặc . Đối với hầu hết các thí nghiệm, sự khác biệt là tích cực hoặc tiêu cực hầu hết thời gian!1 / 2 1 / 2 0 11/21/21/201

Đường cong màu đỏ là hàm mật độ của phân phối arcsin, còn được gọi là phân phối . Những gì được minh họa trong hình trên là một định lý được gọi là định luật arscine đầu tiên cho các bước đi ngẫu nhiên , nói rằng khi số bước của bước đi ngẫu nhiên đối xứng đơn giản tiến đến vô cùng, sự phân bố tỷ lệ thời gian trên có xu hướng phân phối arcsine. Một tài liệu tham khảo tiêu chuẩn cho kết quả này là Phần III.4 Giới thiệu về lý thuyết xác suất và các ứng dụng của nó, Tập 1 của William Feller.Beta(1/2,1/2) 00


Mã R cho nghiên cứu mô phỏng là

prop<-vector(length=10000)
for(i in 1:10000)
{
    steps<-2*rbinom(B,1,0.5)-1
    rw<-cumsum(steps)
    prop[i]<-sum(rw>=0)/B
}
hist(prop,freq=FALSE,xlab="Proportion of time spent above 0",main="George Lucas experiment")
curve(dbeta(x,1/2,1/2),0,1,col=2,add=TRUE)

Cảm ơn! Tôi đã cài đặt R và muốn lặp lại tất cả các bước của bạn - làm cách nào tôi có thể chạy 10.000 mô phỏng và tính tỷ lệ thời gian sử dụng?
andreister

@andreister: Tôi đã chỉnh sửa câu trả lời của mình, thêm mã cho phần mô phỏng ở cuối. Tôi hy vọng bạn thấy nó hữu dụng!
MånsT

Cảm ơn, điều đó rất hữu ích! Để đảm bảo tôi hiểu nội dung, tôi đã tạo pastebin.com/mtRdsPkP dựa trên mã của bạn - bạn có thể lướt qua không?
andreister

@andreister: Trông thật tuyệt! Để trả lời câu hỏi tại sao cumsumđược sử dụng thay vì sumtưởng tượng rằng người xem đang đứng xếp hàng và chúng tôi kiểm tra xem bộ phim nào họ đã mua vé cho từng người một. cumsumđưa ra một vectơ tổng một phần, sao cho phần tử thứ 1 cho chúng ta biết trước / sau A bao xa sau 1 người xem, phần tử thứ 2 đi trước A bao xa sau 2 người xem, phần tử thứ 3 sau 3 người xem, v.v. Nếu yếu tố là tích cực, thì A đã có nhiều người xem hơn sau những người xem đầu tiên . Nếu đó là số âm, B đã có nhiều người xem hơn và nếu là 0 thì họ đã có cùng số lượng người xemtôiii
MånsT

(contd.) Đây là thông tin mà chúng tôi quan tâm, vì chúng tôi muốn xem liệu nhà lãnh đạo có nhìn thấy không. sumsẽ chỉ tổng hợp tất cả 1 và -1, sẽ cho bạn kết quả cuối cùng sau khi tất cả 20.000 người xem đã được tính (tức là yếu tố cuối cùng của cumsumvectơ).
MånsT

11

Cả A và B đều có cơ hội để đi trước sau bất kỳ số lượng thử nghiệm lẻ (lẻ để tránh ràng buộc). Tuy nhiên, những sự kiện này có liên quan. Bất cứ ai đi trước sau đều có cơ hội đi trước sau , và điều này sẽ trở nên kịch tính hơn khi tăng.t t = 1 3 / 4 t = 3 t1/2tt= =13/4t= =3t

Số lượng thay đổi chì trung bình tăng lên vô cùng khi tổng số thử nghiệm tăng, nhưng chậm. Một bước đi ngẫu nhiên không trôi trong chiều được lặp lại, do đó, cho đến nay bạn có thể dẫn đầu, cơ hội bạn sẽ bị ràng buộc tại một thời điểm nào đó trong tương lai (với số lượng thử nghiệm vô hạn) là . Tuy nhiên, ngay cả khi bạn chỉ dẫn một người, thời gian dự kiến ​​cho đến khi bạn thậm chí một lần nữa là vô hạn. Có một cơ hội đáng kể rằng sẽ mất một thời gian rất dài để trở lại thậm chí.111

Điều đó nói rằng, chế độ đang được sử dụng để phóng đại hiệu ứng . Thật sự sẽ rất ngạc nhiên khi không thấy sự thay đổi chì nào trong thử nghiệm.20,000

Nếu bạn muốn tính toán một số xác suất, bạn phải tính một cái gì đó giống với các bước đi trong mạng không đi qua đường chéo. Có một phương pháp tổ hợp tuyệt vời áp dụng cho các bước đi ngẫu nhiên (và cho chuyển động Brown) không vượt qua một đường như vậy, được gọi là nguyên tắc phản xạ hoặc phương pháp phản xạ . Đây là một phương pháp để xác định số Catalan . Đây là hai ứng dụng khác:

Số lượng trình tự sao cho kết thúc trước là . Trong mỗi chuỗi kết thúc tại , hoặc không bao giờ đứng đầu, hoặc có một số điểm mà đầu trong vị trí dẫn đầu. Nếu giành được vị trí dẫn đầu, thì nếu bạn đảo ngược các thử nghiệm sau đó, bạn sẽ nhận được một chuỗi kết thúc tại , và đây là một sự kiện. Vì vậy, số lượng các chuỗi kết thúc tại để không bao giờ dẫn đầu là10 , 200 - 9 , 800 ( 20 , 000Một10,200-9,800(20,0009,800)(10,200,9,800)BBB(9,799,10,201)(10,200,9,800)B(20,0009,800)-(20,00010,201)= =(20,0009,800)-(20,0009,799)= =(20,0009,800)40110,201.Vì vậy, bạn có thể thấy rằng cơ hội đã ở phía trước tại một số thời điểm, với điều kiện là bạn kết thúc ở mức là khoảng .B(10,200,9,800),96%

Tổng số chuỗi với bất kỳ điểm cuối nào để không bao giờ bị tụt lại làVì vậy, xác suất mà không bao giờ đứng sau là về . Cơ hội mà khách hàng không bao giờ thay đổi là vềSố lượng thay đổi chì trung bình là khoảng .Một(20,00010,000)220,000/10,000π.Một1100π150π1/89.56


Cảm ơn! Tôi cần phải hiểu các ký hiệu trước khi tôi hiểu câu trả lời của bạn! Điều đó có nghĩa là gì "kết thúc trước 10,200−9,800", v.v., bạn lấy số từ đâu? Bạn thấy 20K là chế độ như thế nào?
andreister

Các giá trị là một ví dụ. Đó chỉ là một trong những kết quả có thể. Bạn có thể thực hiện phân tích tương tự cho hoặcTôi không nghĩ rằng tôi đã nói là chế độ của bất cứ điều gì. Trích dẫn của bạn cho biết, "số lượng thay đổi có thể xảy ra nhất trong khách hàng tiềm năng là " có nghĩa là là chế độ. Tuy nhiên, điều này tương tự như phân phối hình học với gần bằng . Giá trị rất có thể là (nếu bạn sử dụng quy ước dựa trên ), nhưng không có khả năng. Có rất nhiều khả năng khác với xác suất thấp hơn một chút. 11 , 000 - 9 , 000 10 , 001 - 9 , 999. 20 , 000 0 0 p 0 0 010,200-9,80011,000-9,00010,001-9,999.20,00000p000
Douglas Zare

0

"Có khả năng cao gấp 88 lần rằng một trong hai bộ phim sẽ dẫn đầu qua tất cả 20.000 khách hàng so với điều đó, có nghĩa là, vai chính liên tục bập bênh"

Nói một cách dễ hiểu: một trong những bộ phim được dẫn đầu. Nó phải, vì khách hàng đầu tiên phải đến A hoặc B. Bộ phim đó sau đó có khả năng giữ được vị trí dẫn đầu như mất nó.

Âm thanh có khả năng cao gấp 88 lần , tốt, không thể xảy ra, cho đến khi bạn nhớ rằng việc bập bênh hoàn hảo là không thể thực hiện được. Biểu đồ trong câu trả lời của MansT , hiển thị bằng đồ họa này, thật hấp dẫn phải không.

ASIDE: Cá nhân, tôi nghĩ rằng nó sẽ hơn 88 lần - do <buzzword-alert>tiếp thị lan truyền </buzzword-alert>. Mỗi người sẽ hỏi những người khác những gì họ đã xem, và có nhiều khả năng truy cập cùng một bộ phim. Họ thậm chí sẽ làm điều này trong tiềm thức: mọi người có nhiều khả năng tham gia một hàng dài để đi xem một cái gì đó. Tức là ngay khi có sự ngẫu nhiên giữa một vài khách hàng đầu tiên đã tạo ra một nhà lãnh đạo, tâm lý con người sẽ giữ nó như một nhà lãnh đạo :-).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.