Thời gian để đánh một mô hình đầu và đuôi trong một loạt các lần tung đồng xu


26

Lấy cảm hứng từ bài nói chuyện của Peter Donnelly tại TED , trong đó anh ấy thảo luận về việc sẽ mất bao lâu để một mẫu nhất định xuất hiện trong một loạt các lần tung đồng xu, tôi đã tạo ra đoạn script sau trong R. Đưa ra hai mẫu 'hth' và 'ome', nó tính toán trung bình mất bao lâu (tức là có bao nhiêu lần tung đồng xu) trước khi bạn đạt được một trong những mẫu này.

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

Các thống kê tóm tắt như sau,

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000 

Trong buổi nói chuyện, người ta giải thích rằng số lần tung đồng xu trung bình sẽ khác nhau đối với hai mẫu; như có thể thấy từ mô phỏng của tôi. Mặc dù đã xem cuộc nói chuyện một vài lần nhưng tôi vẫn không hiểu tại sao lại như vậy. Tôi hiểu rằng 'hth' chồng chéo lên nhau và theo trực giác tôi sẽ nghĩ rằng bạn sẽ đánh 'hth' sớm hơn 'ome', nhưng đây không phải là trường hợp. Tôi thực sự sẽ đánh giá cao nó nếu ai đó có thể giải thích điều này với tôi.

Câu trả lời:


32

Hãy suy nghĩ về những gì xảy ra khi lần đầu tiên bạn gặp H sau đó là T.

Trường hợp 1: bạn đang tìm HTH và lần đầu tiên bạn nhìn thấy HT. Nếu lần ném tiếp theo là H, bạn đã hoàn thành. Nếu là T, bạn quay lại hình vuông một: vì hai lần ném cuối cùng là TT, giờ bạn cần HTH đầy đủ.

Trường hợp 2: bạn đang tìm HTT và bạn đã thấy HT lần đầu tiên. Nếu lần ném tiếp theo là T, bạn đã hoàn thành. Nếu đó là H, đây rõ ràng là một trở ngại; tuy nhiên, đây là số nhỏ vì bạn hiện có H và chỉ cần -TT. Nếu lần ném tiếp theo là H, điều này làm cho tình trạng của bạn không tệ hơn, trong khi T làm cho nó tốt hơn, v.v.

Nói cách khác, trong trường hợp 2 H đầu tiên mà bạn thấy sẽ đưa bạn đi được 1/3 chặng đường và kể từ thời điểm đó, bạn không bao giờ phải bắt đầu lại từ đầu. Điều này không đúng trong trường hợp 1, trong đó một TT xóa tất cả tiến trình bạn đã thực hiện.


Ồ, vậy trong kịch bản này, việc lật đồng xu không dừng lại khi một mô hình chiến thắng! Điều đó có ý nghĩa. Điều này làm tôi bối rối trong một thời gian (chưa xem cuộc nói chuyện TED) vì vậy tôi nghĩ rằng tôi sẽ bình luận để giúp đỡ những người khác có thể đã nghĩ điều tương tự.

15

Giả sử bạn tung đồng xu lần và đếm số lần bạn nhìn thấy mẫu "HTH" (bao gồm cả chồng chéo). Số lượng dự kiến ​​là . Nhưng nó cũng là cho "HTT". Vì có thể tự trùng lặp và "HTT" không thể, bạn sẽ mong đợi nhiều hơn với "HTH", điều này làm tăng thời gian dự kiến ​​cho lần xuất hiện đầu tiên của . n n H T H H T Hsố 8n+2nnHTHHTH

Một cách nhìn khác là sau khi đạt "HT", "T" sẽ gửi "HTH" trở lại từ đầu, trong khi "H" sẽ bắt đầu tiến tới "HTT" có thể.

Bạn có thể tìm ra hai lần dự kiến ​​bằng thuật toán của Conway [tôi nghĩ], bằng cách xem xét các phần trùng lặp: nếu tung đầu tiên của mẫu khớp với cuối cùng , sau đó thêm . Vì vậy, đối với "HTH", bạn nhận được như mong đợi và đối với "HTT", bạn nhận được , xác nhận mô phỏng của bạn.k 2 k 2 + 0 + 8 = 10 0 + 0 + 8 = 8kk2k2+0+số 8= =100+0+số 8= =số 8

Sự kỳ lạ không dừng lại ở đó. Nếu bạn có một cuộc đua giữa hai mẫu, chúng có xác suất xuất hiện trước bằng nhau và thời gian dự kiến ​​cho đến khi một trong số chúng xuất hiện là (nhiều hơn một lần so với dự kiến ​​để có "HT", sau đó một trong số chúng phải xuất hiện) . 5

Điều đó trở nên tồi tệ hơn: trong trò chơi của Penney, bạn chọn một mô hình để đua và sau đó tôi chọn một mô hình khác. Nếu bạn chọn "HTH" thì tôi sẽ chọn "HHT" và có tỷ lệ thắng 2: 1; nếu bạn chọn "HTT" thì tôi sẽ chọn "HHT" lần nữa và vẫn có tỷ lệ cược 2: 1 có lợi cho tôi. Nhưng nếu bạn chọn "HHT" thì tôi sẽ chọn "THH" và có tỷ lệ cược 3: 1. Người chơi thứ hai luôn có thể thiên vị tỷ lệ cược và các lựa chọn tốt nhất không mang tính bắc cầu.


+1 Cảm ơn liên kết đến trò chơi của Penney; nhiều đêm mất ngủ hơn :)
lafrasu

Henry thân mến, tôi đã hỏi một câu hỏi tương tự trên trang web này, và được yêu cầu tìm câu trả lời ở đây. Tôi đã xem trò chơi của Penney, nhưng vẫn không thể giải quyết được vấn đề của mình. Bất kỳ trợ giúp sẽ được đánh giá cao.
superAnnoyingUser

14

Tôi thích vẽ tranh.

nhập mô tả hình ảnh ở đây

Các sơ đồ này là automata trạng thái hữu hạn (FSAs). Chúng là các trò chơi của trẻ nhỏ (như Chutes và Thang ) "nhận ra" hoặc "chấp nhận" các chuỗi HTT và HTH, tương ứng, bằng cách di chuyển mã thông báo từ nút này sang nút khác để đáp ứng với việc lật đồng xu. Mã thông báo bắt đầu ở nút trên cùng, được chỉ bởi một mũi tên (dòng i ). Sau mỗi lần tung đồng xu, mã thông báo được di chuyển dọc theo cạnh được gắn nhãn kết quả của đồng tiền đó (hoặc H hoặc T) sang một nút khác (mà tôi sẽ gọi lần lượt là "nút H" và "nút T"). Khi mã thông báo hạ cánh trên nút thiết bị đầu cuối (không có mũi tên đi ra, được chỉ thị bằng màu xanh lá cây), trò chơi kết thúc và FSA đã chấp nhận chuỗi.

Hãy nghĩ về mỗi FSA khi tiến dần theo đường thẳng xuống. Việc xé chuỗi "đầu" bên phải của đầu và đuôi khiến mã thông báo tiến tới đích của nó. Việc ném một giá trị "sai" làm cho mã thông báo sao lưu (hoặc ít nhất là đứng yên). Mã thông báo sao lưu trạng thái tiên tiến nhất tương ứng với các lần tung gần đây nhất. Chẳng hạn, HTT FSA ở dòng ii được đặt ở dòng ii khi nhìn thấy một cái đầu, bởi vì cái đầu đó có thể là chuỗi ban đầu của một HTH cuối cùng. Nó không hoàn toàn quay trở lại từ đầu, bởi vì điều đó sẽ hoàn toàn bỏ qua cái đầu cuối cùng này.

Sau khi xác minh hai trò chơi này thực sự tương ứng với HTT và HTH như đã tuyên bố, và so sánh chúng theo từng dòng, và bây giờ rõ ràng là HTH khó giành chiến thắng hơn . Chúng chỉ khác nhau về cấu trúc đồ họa trên dòng iii , trong đó H đưa HTT trở lại dòng ii (và T chấp nhận), nhưng trong HTH, T đưa chúng ta quay trở lại dòng i (và H chấp nhận). Hình phạt ở dòng iii khi chơi HTH nghiêm trọng hơn hình phạt khi chơi HTT.

Điều này có thể được định lượng. Tôi đã gắn nhãn các nút của hai FSA này với số lần tung dự kiến ​​cần thiết để chấp nhận. Hãy để chúng tôi gọi đây là nút "giá trị." Việc ghi nhãn bắt đầu bằng

(1) viết giá trị rõ ràng bằng 0 tại các nút chấp nhận.

Đặt xác suất của các đầu là p (H) và xác suất của các đuôi là 1 - p (H) = p (T). (Đối với một đồng xu công bằng, cả hai xác suất bằng 1/2.) Bởi vì mỗi lần lật đồng xu thêm một vào số lần tung,

(2) giá trị của một nút bằng một cộng với p (H) nhân với giá trị của nút H cộng với p (T) nhân với giá trị của nút T.

Các quy tắc này xác định các giá trị . Đây là một bài tập nhanh và nhiều thông tin để xác minh rằng các giá trị được gắn nhãn (giả sử một đồng tiền công bằng) là chính xác. Ví dụ, xem xét giá trị cho HTH trên dòng ii . Quy tắc nói 8 phải nhiều hơn 1 so với trung bình 8 (giá trị của nút H trên dòng i ) và 6 (giá trị của nút T trên dòng iii ): chắc chắn, 8 = 1 + (1/2) * 8 + (1/2) * 6. Bạn có thể dễ dàng kiểm tra năm giá trị còn lại trong hình minh họa.


Cách tiếp cận của FSA là một cách tuyệt vời để phân tích Trò chơi của Penney (trong bài trả lời của @Henry). Các giá trị được dán nhãn khác nhau một chút: FSA hiện có một nút chấp nhận cho mỗi mẫu. Để tìm cơ hội chiến thắng mẫu của bạn, hãy gắn nhãn nút chấp nhận của nó với 1 và tất cả các nút chấp nhận khác bằng 0. Giá trị tại bất kỳ nút nào khác bằng giá trị trung bình của các giá trị của các nút H và T của nó. Giá trị của nút bắt đầu (duy nhất) là cơ hội chiến thắng.
whuber

0

@gung Cảm ơn vì đã bắt được nó. Tôi đã sửa ví dụ. Tuy nhiên, có một lỗi đánh máy trong hình: có vẻ như giá trị của HTT ở dòng iii phải là 4, thay vì 2.
whuber

4

Một số câu trả lời tuyệt vời. Tôi muốn thực hiện một chiến thuật hơi khác, và giải quyết câu hỏi về tính trực giác. (Tôi khá đồng ý, BTW)

Đây là cách tôi hiểu ý nghĩa của nó. Hãy tưởng tượng một cột kết quả tung đồng xu liên tiếp ngẫu nhiên được in trên băng giấy, bao gồm các chữ cái "H" và "T".

Tự ý xé một phần của băng này, và tạo một bản sao giống hệt nhau.

Trên một băng nhất định, chuỗi HTH và chuỗi HTT sẽ xảy ra thường xuyên, nếu băng đủ dài.

Nhưng đôi khi các trường hợp HTH sẽ chạy cùng nhau, tức là HTHTH. (hoặc thậm chí rất thỉnh thoảng HTHTHTH)

Sự chồng chéo này không thể xảy ra với các trường hợp HTT.

Sử dụng công cụ tô sáng để chọn ra các "kết quả" thành công, HTH trên một băng và HTT trên băng khác. Một vài sọc HTH sẽ ngắn hơn do sự chồng chéo. Do đó, khoảng cách giữa chúng, trung bình, sẽ dài hơn một chút so với các băng khác.

Nó giống như chờ xe buýt, cứ sau năm phút thì có một người. Nếu các xe buýt được phép chồng lên nhau, trung bình khoảng thời gian sẽ dài hơn năm phút một chút, bởi vì đôi khi hai sẽ đi qua với nhau.

Nếu bạn đến vào một thời điểm tùy ý, trung bình bạn sẽ đợi một chút cho xe buýt tiếp theo (với bạn, trước tiên), nếu chúng được phép trùng nhau.


2

Tôi đã tìm kiếm trực giác cho điều này trong trường hợp số nguyên (khi tôi đang viết lách qua Giới thiệu về Mô hình Xác suất của Ross). Vì vậy, tôi đã suy nghĩ về các trường hợp số nguyên. Tôi tìm thấy điều này đã giúp:

Một

B

Một= =BP(MộtB~)= =0

MộtBP(MộtB~)0

Vì vậy, hãy để tôi tưởng tượng rằng tôi có cơ hội hoàn thành mô hình trong lần vẽ tiếp theo. Tôi vẽ biểu tượng tiếp theo và nó không hoàn thành mô hình. Trong trường hợp mẫu của tôi không trùng nhau, biểu tượng được vẽ vẫn có thể cho phép tôi bắt đầu xây dựng lại mẫu ngay từ đầu.

Trong trường hợp trùng lặp, một biểu tượng tôi cần để hoàn thành mô hình bộ phận của mình giống với biểu tượng mà tôi sẽ cần để bắt đầu xây dựng lại. Vì vậy, tôi cũng không thể làm được, và do đó chắc chắn sẽ cần đợi đến lần bốc thăm tiếp theo để có cơ hội bắt đầu xây dựng lại.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.