Có thể ước tính tỷ lệ thắng trong một cuộc thi nhiều mục, khi tôi không biết phân tích các mục?


8

Giả sử tôi tham gia một cuộc thi , với các quy tắc sau:

  • Mỗi người có thể nhận được tối đa 6 mục
  • Tất cả các mục sẽ được gộp lại và 25% các mục sẽ được chọn để trở thành người chiến thắng, tối đa là 25.
  • Mỗi người chỉ có thể giành được một lần, bất kể số lượng mục của họ. Nếu tên của ai đó được rút ra một lần nữa, nó sẽ bị loại bỏ và một tên mới được rút ra.
  • Tôi biết tôi có bao nhiêu mục (tối đa, 6)
  • Tôi biết có bao nhiêu tổng số mục, được chia theo loại mục
  • Tôi không biết có bao nhiêu mục được lặp lại bởi cùng một người.

Số lượng mục nhập theo loại như sau:

Loại 1: 42 Loại 2: 72 Loại 3: 119 Loại 4: 217 Loại 5: 156 Loại 6: 178

Có thể ước tính tỷ lệ thắng của tôi trong tình huống này không? Tôi hơi bối rối bởi thực tế là tôi không thể dự đoán những người chiến thắng sớm sẽ ảnh hưởng đến cơ hội của tôi như thế nào, vì tôi không biết mỗi người chiến thắng sẽ xóa bao nhiêu mục từ nhóm.

Tôi quan tâm đến giải pháp được cung cấp cho tập dữ liệu, nhưng tôi cũng quan tâm đến quy trình / thuật toán thích hợp để tính toán nó.


"Các loại" biểu thị điều gì?
Macro

@Marco Các loại vé khác nhau mà bạn có thể kiếm được. Vì vậy, bạn có thể kiếm được vé số loại 1 đến 6 và 42 người đã giành được loại vé số 1
Rachel

Tôi gặp khó khăn sau chuỗi bài viết vì chúng chạy từ dưới lên trên. Nhưng với thời gian ở bên phải của tên người đăng tôi nghĩ rằng tôi đã tìm ra nó. Vì vậy, ai đó xin vui lòng cho tôi biết nếu tôi có điều này thẳng. Tôi nghĩ rằng câu trả lời của người không thể đúng vì sự mơ hồ giữa các mục và người đăng ký. Chiến lược của Rachel để có được trường hợp xấu nhất và các tình huống tốt nhất là đúng nhưng cô ấy đã mắc lỗi toán học bằng cách thêm tỷ lệ phần trăm khi chúng có thể dựa trên các mẫu số khác nhau. Vì vậy, nếu chúng tôi sửa lỗi đó, chúng tôi có giới hạn đúng về giải pháp.
Michael R. Chernick

Tôi nghĩ thật kỳ quặc khi Rachel đề cập đến trường hợp tốt nhất là kịch bản có tỷ lệ thắng cao nhất và trường hợp xấu nhất là trường hợp thấp nhất. Chiến thắng là tốt phải không? Điểm cuối cùng mà tôi muốn làm rõ: Hồng y tuyên bố rằng trong trường hợp này, 25% số người tham gia vượt quá 25, vì vậy sẽ chỉ có 25 người chiến thắng. Anh ta có được điều này bằng cách biết rằng ít nhất 178 người được tham gia và tất nhiên một khi số lượng người đăng ký vượt quá 100 thì tổng số người chiến thắng bị cắt ở mức 25 dựa trên các quy tắc.
Michael R. Chernick

@cardinal làm thế nào bạn đến với số 178? Tôi đã thêm tất cả các mục theo loại để có tổng cộng 784. Trong trường hợp xấu nhất đối với tôi, người chơi có 6 mục và 784/6 = 130,7. Vì vậy, tôi kết luận rằng phải có ít nhất 130 lối vào. Điều này vẫn có nghĩa là mức cắt 25 được áp dụng, nhưng làm thế nào bạn đạt được con số cao hơn?
Michael R. Chernick

Câu trả lời:


6

Cơ hội có thể nằm trong khoảng từ 17,7% đến 18,7%.

Trường hợp xấu nhất xảy ra khi tất cả mọi người nhưng bạn có chính xác một mục trong xổ số: đây là cấu hình phù hợp với dữ liệu (mặc dù không thể!).

Hãy đếm số khả năng mà bạn không giành chiến thắng. Đây là số cách rút vé trong số vé còn lại, được đưa ra bởi hệ số Binomial . (Đó là một con số khổng lồ). Tổng số khả năng - tất cả đều có khả năng như nhau trong một bản vẽ công bằng - là . Tỷ lệ đơn giản hóa thành , khoảng 82.22772%: cơ hội bạn không chiến thắng. Do đó, cơ hội chiến thắng của bạn trong tình huống này bằng 1 - 82.22772% = 17.7228% .784 - 6 ( 784 - 6257846( 784(784625) (784-25)(784-30)/[(784)(784-5)](78425)(78425)(78430)/[(784)(7845)]

Trường hợp tốt nhất xảy ra khi có càng ít cá nhân tham gia xổ số càng tốt và càng nhiều càng tốt có , và sau đó , v.v. Cho rằng số "đá quý" là (theo thứ tự tăng dần), điều này ngụ ý5 ( 42 , 72 , 119 , 156 , 178 , 217 )65(42,72,119,156,178,217)

  • Tại hầu hết các mọi người có thể có mục mỗi. 642=a66

  • Tại hầu hết các mọi người có thể có mục mỗi. 57242=30=a55

    ...

  • Tại hầu hết các mọi người có thể có mục mỗi. 2178156=22=a22

  • 1217178=39=a1 người có mục nhập.1

Đặt chỉ định cơ hội chiến thắng khi bạn giữ vé (từ đến ) trong xổ số với dữ liệu và trận hòa. Do đó, tổng số vé bằng . Hãy xem xét trận hòa tiếp theo. Có bảy khả năng:j 1 6 a = ( a 1 , a 2 , Sóc , a 6 ) l = 25 1 a 1 + 2 a 2 + + 6 a 6 = np(a,l,j)j16một= =(một1,một2,Giáo dục,một6)tôi= =251một1+2một2++6một6= =n

  1. Một trong những vé của bạn được rút ra; bạn thắng. Cơ hội này bằng .j/n

  2. Vé của ai đó được rút ra. Cơ hội của điều này bằng . Nếu họ giữ của họ, thì tất cả vé sẽ bị xóa khỏi xổ số. Nếu , bản vẽ tiếp tục với dữ liệu mới: đã bị giảm và cũng bị giảm . Cơ hội mà một số người có vé trong xổ số được chọn, cho rằng bạn không phải, bằng . Điều này mang lại sáu khả năng phân biệt cho .i i l 1 l 1 a i 1 i i a i / ( n - j ) i = 1 , 2 , Câu , 6(n-j)/nTôiTôitôi1tôi1mộtTôi1TôiTôimộtTôi/(n-j)Tôi= =1,2,Giáo dục,6

Chúng tôi thêm các cơ hội này vì chúng phân vùng tất cả các kết quả không có sự chồng chéo.

Tính toán tiếp tục đệ quy xuống cây xác suất này cho đến khi đạt được tất cả các lá ở . Đó là rất nhiều tính toán (khoảng = 244 triệu phép tính), nhưng chỉ mất vài phút (hoặc ít hơn, tùy thuộc vào nền tảng). Tôi có được 18,6485% cơ hội chiến thắng trong trường hợp này.25 6tôi= =0256

Đây là Mathematica mã tôi sử dụng. (Nó được viết song song các phân tích trước đó, nó có thể được thực hiện một chút hiệu quả hơn thông qua một số cắt giảm đại số và kiểm tra khi được giảm xuống .) Ở đây, lập luận nào không đếm vé bạn giữ: nó mang lại sự phân bố số lượng vé mọi người khác giữ. 0 jmộtTôi0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Để kiểm tra thực tế, chúng ta hãy so sánh các câu trả lời này với hai xấp xỉ ngây thơ (cả hai đều không đúng):

  1. 25 trận hòa với 6 vé đang chơi sẽ cung cấp cho bạn khoảng 6 * 25 trên tổng số 784 cơ hội chiến thắng. Đây là 19,1%.

  2. Mỗi lần cơ hội không chiến thắng của bạn là khoảng (784-6) / 784. Nâng mức này lên sức mạnh thứ 25 để tìm cơ hội không trúng xổ số. Trừ nó từ 1 cho 17,5%.

Có vẻ như chúng ta đang ở đúng sân bóng.


1
Tôi thích vấn đề này vì nó cung cấp một ví dụ thực tế về hai loại không chắc chắn: không chắc chắn về xác suất trong xổ số và thiếu kiến ​​thức về phân phối quyền sở hữu vé thực sự trong xổ số. Tôi đã xử lý hiệu quả sự không chắc chắn sau bằng cách sử dụng phân tích khoảng, chỉ đơn giản là cố gắng ràng buộc các khả năng càng chặt chẽ càng tốt. Những người khác có thể đi trước và chấp nhận một số phân phối trước để mô tả sự không chắc chắn epistemia này, nhưng tôi có thể hình dung không có cách nào hợp lệ để biện minh cho bất kỳ thông tin nào trước đó đưa ra thông tin trong tay.
whuber

Nhưng bạn đang giả định rằng không ai có thể có 2 hoặc nhiều loại vé cụ thể ("đá quý"). Theo như tôi có thể thấy điều này không được chỉ định trong mô tả của OP (agent86s) về vấn đề.
Michael R. Chernick

@Michael Bạn nói đúng, nó không hoàn toàn rõ ràng trong các quy tắc trò chơi, mặc dù điều đó ngụ ý mạnh mẽ rằng không ai thu thập nhiều hơn một loại đá quý. Vide quy tắc 1 trong câu hỏi ban đầu: "tất cả mọi người có thể nhận được tối đa 6 mục."
whuber

1
Theo như tôi biết (và đã được chứng minh trong suốt cuộc thi), giả định từ thông tin đã cho là chính xác - không ai có thể có nhiều hơn 6 mục, một trong mỗi "loại".
vụ86

1
Cảm ơn bạn rất nhiều vì đã dành thời gian để trả lời này! Tôi đã nghĩ về vấn đề này từ hôm qua, và thức dậy sáng nay đã quyết định tìm ra vấn đề này nếu nó giết tôi, và tôi rất vui khi thấy một lời giải thích tuyệt vời đã được đăng lên nên bây giờ tôi không phải :)
Rachel

1

Nếu tôi đã làm đúng toán, bạn có giữa 19.43%21.15%cơ hội chiến thắng một giải thưởng

Đây 19.43%là trường hợp tốt nhất, trong đó mỗi người đăng ký có 6 vé

Các 21.15%là kịch bản trường hợp xấu nhất, nơi mà mọi người đăng có 1 vé ngoại trừ bạn

Cả hai kịch bản đều rất khó xảy ra, do đó, tỷ lệ thắng thực tế của bạn có thể rơi vào khoảng giữa, tuy nhiên cơ hội chiến thắng khoảng 1/5 dường như là một con số khá chắc chắn.

Tuy nhiên, chi tiết về cách những con số đó được lấy có thể được tìm thấy trong bảng tính Google này , tuy nhiên để tóm tắt cách chúng được lấy:

  1. Bắt đầu với Tổng số mục nhập (784) và mục nhập của bạn (6)
  2. Có cơ hội chiến thắng ( 6 / 784 = 0.77%)
  3. Trừ 6 cho trường hợp tốt nhất hoặc 1 cho trường hợp xấu nhất từ TotalEntries
  4. Có cơ hội chiến thắng ( 6/778trong trường hợp tốt nhất 6/783cho trường hợp xấu nhất)
  5. Lặp lại các bước 3-4 cho đến khi bạn có 25 phần trăm
  6. Cộng 25 phần trăm lại với nhau để tìm ra cơ hội tổng thể của bạn trong việc giành được thứ gì đó

Đây là một cách khác để có được tỷ lệ phần trăm xấp xỉ đơn giản hơn, nhưng không chính xác vì bạn không xóa các mục trùng lặp mỗi khi bạn giành chiến thắng.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDIT: Tôi khá chắc chắn rằng tôi đang thiếu một cái gì đó trong toán học của mình và rằng bạn không thể đơn giản thêm tỷ lệ phần trăm như thế này (hoặc nhân cơ hội phần trăm để giành được # giải thưởng), mặc dù tôi nghĩ rằng tôi đã đóng

Nhận xét của Whobar mang lại 17,4% cơ hội chiến thắng, mặc dù tôi vẫn cần tìm ra công thức anh ấy đưa ra và đảm bảo nó chính xác cho cuộc thi. Có lẽ là một dự án cuối tuần :)


Tôi sẽ chỉ ra rằng điều này giả định rằng bạn có 6 viên đá quý.
murgatroid99

@ murgatroid99 Có, câu hỏi đã nêu I know how many entries I have (the maximum, 6):) Tôi có thể chỉnh sửa bảng tính bởi bất kỳ ai muốn tìm ra tỷ lệ thắng của họ
Rachel

2
Tôi nghĩ rằng những con số này nói chung là ở sân bóng phải, nhưng giảm đi một vài phần trăm. Thật khó để nói vì một mô tả về tính toán bạn đã thực hiện chưa được cung cấp trong chính bài đăng.
Đức hồng y

1
k(7787776)/(784783782)

2
1-(n-625)(n25)6n1n= =784
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.