Điều gì sẽ là câu trả lời chính xác, nếu chúng ta sửa đổi câu hỏi về số liệu thống kê hay nhất từ ​​trước đến giờ?


8

Có một câu hỏi phổ biến, được gọi là "Câu hỏi thống kê tốt nhất từng có".

Nếu bạn chọn một câu trả lời cho câu hỏi này một cách ngẫu nhiên, cơ hội bạn sẽ đúng là gì?

A) 25% B) 50% C) 60% D) 25%

Nhiệm vụ này không khó lắm, câu trả lời đúng là 0%. Nhưng nếu chúng ta sửa đổi nó như thế này:

Nếu bạn chọn một câu trả lời cho câu hỏi này một cách ngẫu nhiên, cơ hội bạn sẽ đúng là gì?

A) 50% B) 25% C) 60% D) 50%

Điều gì sẽ là câu trả lời chính xác? Chúng ta có hai câu trả lời đúng không: 25% và 50%, hoặc không có câu trả lời đúng, vì với hai câu trả lời đúng này, cơ hội chọn câu trả lời đúng thực tế là 75% (nhưng chúng ta không có 75% được viết trên bàn )?

Nhân tiện. Câu trả lời 0% có còn là câu trả lời đúng không, câu trả lời đúng thứ ba trong trường hợp này?


1
Câu trả lời, tất nhiên, phụ thuộc vào cách lựa chọn ngẫu nhiên được thực hiện. "
Ngẫu

Hãy giả sử "thống nhất ngẫu nhiên". Logic đằng sau câu hỏi ban đầu là: Vì câu trả lời 25% có 50% xác suất được chọn và câu trả lời 50% và 60% có 25% xác suất được chọn, câu trả lời này không chính xác. Câu trả lời 0% là chính xác, vì xác suất để chọn nó là 0%.
Nick

2
Vấn đề này đã được phân tích thấu đáo trên math.SE một thời gian trở lại.
Đức hồng y

4
@whuber: Đây là người có nhiều phiếu bầu nhất . Có những người khác, nhưng có lẽ họ đã đóng / sáp nhập.
Đức hồng y

2
@ Cardinal Cảm ơn. Tôi đoán tôi rất vui khi thấy dường như không có câu trả lời sâu hoặc sáng nào ở đó (mặc dù có nhiều phiếu bầu nặng nề), bởi vì điều đó có nghĩa là có thể có một số phạm vi cho việc chú giải thêm ở đây :-).
whuber

Câu trả lời:


11

Những nghịch lý rõ ràng (về logic hoặc xác suất) có thể được giải quyết bằng cách đóng khung các câu hỏi một cách rõ ràng và cẩn thận.

Phân tích sau đây được thúc đẩy bởi ý tưởng bảo vệ một câu trả lời: khi một người làm bài kiểm tra có thể thể hiện một trạng thái có thể xảy ra (phù hợp với tất cả các thông tin có sẵn) trong đó câu trả lời của họ thực sự là chính xác, thì nó nên được đánh dấu là chính xác. Tương tự, một câu trả lời là không chính xác khi không có sự bảo vệ như vậy tồn tại; nó được coi là chính xác khác. Mô hình này mô hình các tương tác thông thường giữa các học sinh lớp (nhân từ, hợp lý) và người kiểm tra (hợp lý) :-). Nghịch lý rõ ràng được giải quyết bằng cách thể hiện nhiều biện pháp phòng vệ như vậy cho câu hỏi thứ hai, chỉ một trong số đó có thể áp dụng trong mọi trường hợp.


Tôi sẽ hiểu ý nghĩa của "ngẫu nhiên" trong những câu hỏi này theo nghĩa thông thường: để mô hình hóa một lựa chọn trả lời ngẫu nhiên, tôi sẽ viết mỗi câu trả lời trên một tờ giấy ("vé") và đặt nó vào một hộp: đó sẽ là Tổng cộng bốn vé. Rút một vé ra khỏi hộp (sau khi xáo trộn một cách cẩn thận và mù quáng nội dung của hộp) là một mô hình vật lý cho sự lựa chọn "ngẫu nhiên". Nó thúc đẩy và biện minh cho một mô hình xác suất tương ứng .

Bây giờ, "chính xác" nghĩa là gì? Trong sự thiếu hiểu biết của tôi, tôi sẽ khám phá tất cả các khả năng. Trong mọi trường hợp, tôi coi đó là số không, một hoặc thậm chí nhiều vé hơn có thể là "chính xác". (Làm sao tôi biết được? Tôi chỉ cần tham khảo bảng chấm điểm!) Tôi sẽ đánh dấu các câu trả lời "đúng" bằng cách viết giá trị trên mỗi vé chính xác và viết 0 cho những người khác. Đó là thói quen và không nên tranh cãi.10

Một điều rõ ràng nhưng quan trọng cần lưu ý là quy tắc viết hoặc 1 phải chỉ dựa trên câu trả lời được viết trên mỗi vé: về mặt toán học, đó là một ánh xạ (hoặc gán lại) gửi bộ câu trả lời được liệt kê ( { .25 , . 50 , .60 } trong cả hai câu hỏi) vào tập { 0 , 1 } . Quy tắc này là cần thiết cho sự tự thống nhất.01{0,25,.50,.60}{0,1}

Chúng ta hãy chuyển sang yếu tố xác suất của câu hỏi: theo định nghĩa, cơ hội chính xác, theo một bản vẽ ngẫu nhiên của vé, là kỳ vọng về các giá trị mà chúng đã được đánh dấu. Kỳ vọng được tính bằng cách tính tổng các giá trị trên vé và chia cho tổng số của chúng. Do đó, nó sẽ là , .25 , .50 , .75 hoặc 1 .00,25.500,751

1

Những dấu hiệu nào có ý nghĩa?

3+3= =60(0+0+0+0)/4= =0. Điều đó biện minh cho câu trả lời đã nêu cho câu hỏi đầu tiên. (Có thể cho rằng, câu trả lời đúng duy nhất cho câu hỏi đầu tiên là không chọn bất kỳ câu trả lời nào!)

Trong câu hỏi thứ hai , cùng một câu trả lời xuất hiện và một lần nữa có sáu dấu hiệu để khám phá. Lần này, ba dấu hiệu là tự nhất quán. Tôi lập bảng cho họ:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Do đó, có ba định nghĩa riêng biệt về "chính xác" trong vấn đề thứ hai, dẫn đến A hoặc D đúng (trong giải pháp 1) hoặc chỉ B đúng (trong giải pháp 2) hoặc không có câu trả lời nào đúng (trong giải pháp 2) dung dịch 3).

0,25.50 người làm bài kiểm tra sẽ có cơ sở hợp pháp để tranh luận về điểm của bạn: họ sẽ gọi giải pháp 1 hoặc giải pháp 2. Thật vậy, nếu người làm bài kiểm tra từ chối trả lời câu hỏi, giải pháp 3 sẽ cho họ cơ sở hợp pháp để cho rằng họ không -response cũng nên nhận được tín dụng đầy đủ!

Tóm lại, phân tích này giải quyết phần thứ hai của câu hỏi bằng cách kết luận rằng bất kỳ câu trả lời nào sau đây cho câu hỏi 2 phải được đánh dấu chính xác vì mỗi câu hỏi đều có thể phòng thủ được : A, B, D, A và D, và không có gì. Không có phản ứng khác có thể được bảo vệ và do đó sẽ không chính xác.


1
Vậy câu trả lời của bạn cho câu hỏi 2 là gì? Có vẻ như bạn đã đưa ra một lời giải thích vô cùng phức tạp với ba câu trả lời nhất quán có thể. Tôi vẫn duy trì rằng điều này chỉ ra một vấn đề với định nghĩa chính xác.
Michael R. Chernick

2
@Michael Cảm ơn bạn: Tôi đã thêm một đoạn để đưa ra kết luận hoàn toàn rõ ràng. Tôi sẽ thừa nhận để tạo ra một câu trả lời tương đối dài (có lẽ được chứng minh bằng thời gian trả lời tập thể lớn hơn nhiều ở đây và trên trang web toán học). "Vô cùng phức tạp" phải nằm trong mắt của kẻ si tình: Tôi đã làm việc để đưa ra những ý tưởng đơn giản nhất có thể để độc giả có thể dễ dàng kiểm tra xem tôi không cố lừa dối họ. Khi những người khác tuyên bố rằng có một "nghịch lý" hoặc "câu hỏi theo logic", điều cốt yếu là phải đơn giản, rõ ràng và rõ ràng, mặc dù làm như vậy có thể làm tăng thời lượng.
whuber

1
@Michael Tôi đánh giá cao điều đó. Bản thân tôi có một chút khác biệt về độ phân giải này, bởi vì mọi người không thoải mái với ý tưởng rằng có thể có nhiều câu trả lời đúng để xóa các câu hỏi đơn giản. Tôi mời đánh giá quan trọng về ý tưởng "phòng thủ" này như một cách xoay quanh nghịch lý rõ ràng. Đối với tôi, nó có vẻ như là một cách ban đầu để tránh né những kết luận tiêu cực mà người khác đạt được (cụ thể là câu hỏi thứ hai là vô nghĩa, hoặc vô nghĩa, hoặc phi logic). Giá trị chính của việc kiểm tra các nghịch lý nằm ở việc khuyến khích kiểm tra sâu hơn các ý tưởng cơ bản.
whuber

1
À, đó là vấn đề, @Michael: mặc dù cả ba đều trái ngược nhau, nhưng mỗi thứ đều có thể phòng thủ được. Tôi đã cung cấp sự bảo vệ trong phần giải thích dẫn đến các giải pháp được lập bảng. Hãy thực hành ở đây: hãy tưởng tượng bạn là một giáo viên tại một tổ chức Ivy League (nơi không may là học sinh và phụ huynh của họ, đã trở nên khá tranh chấp trong những năm gần đây) và bạn đã đưa ra những câu hỏi như một phần của bài kiểm tra. Làm thế nào để bạn xếp loại chúng? Phân tích của tôi cho thấy một cách hợp lý, khách quan, công bằng và tránh tranh luận giữa giáo viên và học sinh - mặc dù các học sinh có thể khác nhau giữa họ!
whuber

2
Có vấn đề của bạn, @Michael: giả định rằng phải có một câu trả lời duy nhất cho câu hỏi trắc nghiệm. (Nói chuyện với các bác sĩ mà bạn biết và hỏi họ về các câu hỏi trắc nghiệm trong bài kiểm tra chứng chỉ hội đồng quản trị của họ: ít nhất trong quá khứ, một số câu trả lời cho mỗi câu hỏi sẽ chính xác.) Ở đây, sự hiện diện của hai câu trả lời giống nhau cho câu hỏi thứ hai cho biết khả năng nhiều câu trả lời cho một câu hỏi có thể được coi là chính xác .// Tại thời điểm này, chúng tôi có vẻ có nguy cơ bỏ qua vấn đề này, vì vậy nếu bạn có thêm nhận xét, vui lòng bắt đầu một phòng trò chuyện.
whuber

9

Tôi nghĩ rằng có một vấn đề ngữ nghĩa ở đây ngoài xác suất. Lựa chọn ngẫu nhiên là rõ ràng. Mỗi A, B, C và D sẽ được chọn 25%. Nhưng điều gì có nghĩa là chính xác khi bạn chọn ngẫu nhiên? Có vẻ như điều đó có nghĩa là bạn đã chọn A làm câu trả lời cho% chính xác của các mẫu sẽ đúng và giống với B, C và D. Vì vậy, bạn phải đếm 1/4 cho mỗi câu trả lời đúng và tổng hợp tất cả các câu trả lời đúng để có được tỷ lệ phần trăm chính xác. Nhưng điều này dẫn đến một cuộc tranh cãi tròn. Do đó nghịch lý. Đây thực sự có vẻ là một câu hỏi trong logic hơn là xác suất hoặc thống kê.


1
+1. Tôi đã tự hỏi mình "Nhưng điều đó có nghĩa là gì ...?". Tôi đồng ý rằng đây dường như là một câu đố logic hơn là một câu hỏi xác suất (mặc dù tôi muốn nghe một lời giải thích từ ai đó về lý do tại sao nhận thức này là sai).
Macro

Logic đằng sau câu hỏi ban đầu giống như bạn đã mô tả. Vì câu trả lời 25% có 50% xác suất được chọn và câu trả lời 50% và 60% có 25% xác suất được chọn, câu trả lời này không chính xác. Câu trả lời 0% là chính xác, vì xác suất để chọn nó là 0%. Điều này nhắc nhở đối số vòng tròn, nhưng điều này làm cho câu hỏi không chính xác?
Nick

@Nick Tôi không nghĩ vậy. Tôi nghĩ rằng các đối số tròn làm cho nó không xác định. Bạn không thể nói câu trả lời nào đúng và bạn không thể nói câu trả lời nào không đúng. Vì vậy, 0% không phải là câu trả lời. Câu hỏi không thể được trả lời. Có lẽ bạn có thể nói rằng 60% là không chính xác bởi vì nếu có câu trả lời thì nó sẽ phải là bội số của 1/4.
Michael R. Chernick

1

whuber đưa ra một phân tích tuyệt vời trong đó nhiều câu trả lời được cho phép. Tuy nhiên, cũng có một cách nhất quán để hiểu câu hỏi sao cho chỉ có một câu trả lời đúng duy nhất (mặc dù chúng ta cần nêu câu này như một phần của câu hỏi):

Nếu bạn chọn một câu trả lời cho câu hỏi này một cách ngẫu nhiên, cơ hội bạn sẽ đúng là gì, cho rằng chỉ có một câu trả lời đúng duy nhất?

A) 50% B) 25% C) 60% D) 50%

{0,1}

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Tuy nhiên, chúng ta cần một bước hợp lý khác để thu hẹp những điều này xuống một câu trả lời phòng thủ duy nhất. Khi thực hiện vấn đề này, giáo viên đã phải đối mặt với ba dấu hiệu có thể xảy ra, mỗi câu có thể là một câu trả lời duy nhất có thể chấp nhận như những câu hỏi khác. Tuy nhiên, vì chỉ có một câu trả lời có thể đúng, giáo viên nên chọn ngẫu nhiên giữa chúng. Điều này gán một xác suất bằng nhau cho mỗi đánh dấu để:

  • 1/350%
  • 1/325%
  • 1/30%

(50+25+0)/3= =25

Tóm tắt: Nếu chúng tôi xác định rằng chỉ có một câu trả lời đúng duy nhất, thì câu trả lời đó là 25%.


Bạn có thể giải thích lời biện minh cho "Tuy nhiên, vì chỉ có một câu trả lời có thể đúng, giáo viên nên chọn ngẫu nhiên giữa chúng"? Tôi không thấy lý do tại sao một sự lựa chọn ngẫu nhiên được yêu cầu tại thời điểm này.
whuber

Tất nhiên có thể là giáo viên có thể có một số thành kiến, nhưng không có lý do để nghĩ rằng có một. Trong trường hợp hoàn toàn không có bất kỳ thông tin nào khác, tôi nghĩ rằng lý do trước khi giả định là sự lựa chọn tuân theo phân phối thống nhất. Hãy cho tôi biết nếu điều này có vẻ nhầm.
WJ Zeng

Tôi không biết liệu nó có bị nhầm hay không, nhưng gọi nó là "sự hợp lý trước" dường như không giống bất kỳ lời giải thích nào cả. Điều làm phiền tôi là "chỉ định rằng chỉ có một câu trả lời đúng" có thể trái ngược nhau, trong trường hợp không có phân phối trước sẽ có liên quan. Hơn nữa, phác thảo logic của lập luận của bạn dường như là "nếu chúng tôi giả sử có một câu trả lời đúng duy nhất và chúng tôi cũng áp dụng phân phối trước trong số ba câu trả lời đúng có thể, thì chúng tôi kết luận có một câu trả lời đúng duy nhất." Điều đó trông cực kỳ tròn trịa, nhưng có lẽ nó có thể được sửa chữa.
whuber

0

Tôi tin rằng câu trả lời là 1/3. Chúng tôi không biết câu trả lời nào (25%, 50% hoặc 60%) là đúng. Vì vậy, mỗi câu trả lời, 25%, 50% và 60% có 1/3 cơ hội đúng nếu được chọn. Mặc dù 25% xuất hiện hai lần, nó vẫn có 1/3 cơ hội là câu trả lời đúng. Nó thực sự không quan trọng bao nhiêu lần 25% xuất hiện như một câu trả lời. Nếu nó xuất hiện 10 lần cùng với 50% và 60%, khả năng đó là câu trả lời đúng sẽ vẫn là 1 / 3. Điều này giả định rằng một trong những câu trả lời là đúng. Nếu có khả năng không có câu trả lời nào là đúng, thì câu trả lời sẽ là 1/4. Điều này dựa trên sự giải thích của tôi về những gì câu hỏi đang hỏi.


1
Nỗ lực này trong một lời giải thích không thành công vì nó vô hiệu hóa sự thiếu hiểu biết (chúng tôi không biết câu trả lời nào trong ba câu trả lời sẽ đúng) với xác suất (gán 1/3 cho mỗi câu trả lời).
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.