Nếu 900 trên 1000 người nói rằng một chiếc xe có màu xanh thì xác suất nó có màu xanh là bao nhiêu?


114

Điều này ban đầu nảy sinh liên quan đến một số công việc chúng tôi đang làm với một mô hình để phân loại văn bản tự nhiên, nhưng tôi đã đơn giản hóa nó ... Có lẽ quá nhiều.

Bạn có một chiếc xe màu xanh (theo một số biện pháp khoa học khách quan - đó là màu xanh).

Bạn chỉ cho 1000 người.

900 nói nó có màu xanh. 100 không.

Bạn cung cấp thông tin này cho một người không thể nhìn thấy chiếc xe. Tất cả những gì họ biết là 900 người nói rằng nó có màu xanh và 100 người thì không. Bạn không biết gì thêm về những người này (1000).

Dựa trên điều này, bạn hỏi người đó, "xác suất chiếc xe có màu xanh là gì?"

Điều này đã gây ra sự khác biệt lớn về quan điểm giữa những người tôi đã hỏi! Câu trả lời đúng là gì, nếu có?


162
Tôi tự hỏi câu trả lời sẽ là gì nếu bạn đổi xe sang ăn mặc .
dùng1717828

13
Vậy câu hỏi cho mọi người là gì? "Xe có màu xanh không?" hoặc "Chiếc xe màu gì?"
tâm lý kon

13
Nó có nghĩa là gì cho chiếc xe có màu xanh? Nếu một số người nói rằng chiếc xe không phải là màu xanh, thì có khả năng đó là màu mà một số người gọi là màu xanh và những người khác gọi bằng một tên khác. Điều này không có nghĩa là họ không đồng ý về màu sắc, điều đó có nghĩa là họ không đồng ý với tên của màu đó.
Ben

7
Tôi nghĩ rằng câu hỏi sẽ được cải thiện rất nhiều nếu bạn đưa ra những ý kiến ​​khác nhau mà bạn gặp phải. Hiện tại, câu trả lời chỉ có thể khám phá toàn bộ lĩnh vực, từ lý thuyết xác suất đến lý thuyết màu sắc hoặc thậm chí sinh học (mù màu) một cách điên cuồng, và tôi không thấy điều đó thực sự sẽ giúp bạn như thế nào.
AnoE

32
Có một cái gì đó còn thiếu trong mô tả vấn đề. 100 người phủ nhận rằng chiếc xe có màu xanh khi nó chắc chắn là màu xanh rất nhiều người, bạn không thể đơn giản loại bỏ chúng là lỗi ngẫu nhiên.
Aksakal

Câu trả lời:


117

TL; DR: Trừ khi bạn cho rằng mọi người rất tệ trong việc đánh giá màu xe, hoặc những chiếc xe màu xanh rất hiếm một cách vô lý, số lượng lớn người trong ví dụ của bạn có nghĩa là xác suất xe có màu xanh về cơ bản là 100%.

Matthew Drury đã đưa ra câu trả lời đúng nhưng tôi chỉ muốn thêm vào đó bằng một số ví dụ bằng số, vì bạn đã chọn các số của mình để bạn thực sự nhận được câu trả lời khá giống nhau cho một loạt các cài đặt tham số khác nhau. Ví dụ, giả sử, như bạn đã nói trong một trong những bình luận của bạn, rằng xác suất mà mọi người đánh giá màu xe chính xác là 0,9. Đó là: và cả p ( nói nó không phải màu xanh | xe hơi không phải màu xanh ) = 0,9 = 1 - p ( nói nó là màu xanh | xe không phải màu xanh )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Đã xác định điều đó, điều còn lại chúng ta phải quyết định là: xác suất trước đó của chiếc xe có màu xanh là gì? Chúng ta hãy chọn một xác suất rất thấp chỉ để xem điều gì xảy ra và nói rằng , tức là chỉ 0,1% trong số tất cả các xe có màu xanh. Sau đó, xác suất sau mà chiếc xe có màu xanh có thể được tính là:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Nếu bạn nhìn vào mẫu số, khá rõ ràng rằng thuật ngữ thứ hai trong tổng đó sẽ không đáng kể, vì kích thước tương đối của các điều khoản trong tổng bị chi phối bởi tỷ lệ đến , là theo thứ tự . Và thực tế, nếu bạn thực hiện phép tính này trên máy tính (chú ý tránh các sự cố tràn số), bạn sẽ nhận được câu trả lời bằng 1 (trong độ chính xác của máy). 0,1 900 10 580.99000.19001058

Lý do các xác suất trước đây không thực sự quan trọng ở đây là vì bạn có quá nhiều bằng chứng cho một khả năng (chiếc xe có màu xanh) so với khả năng khác. Điều này có thể được định lượng theo tỷ lệ khả năng mà chúng ta có thể tính toán như sau:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Vì vậy, ngay cả trước khi xem xét các xác suất trước đó, bằng chứng cho thấy rằng một lựa chọn đã có khả năng thiên văn hơn so với lựa chọn khác, và trước khi có bất kỳ sự khác biệt nào, những chiếc xe màu xanh sẽ phải cực kỳ hiếm, rất hiếm (chúng ta mong đợi tìm 0 ô tô màu xanh trên trái đất).

Vậy điều gì sẽ xảy ra nếu chúng ta thay đổi cách mọi người chính xác trong mô tả của họ về màu xe? Tất nhiên, chúng ta có thể đẩy điều này đến mức cực đoan và nói rằng họ hiểu đúng chỉ 50% thời gian, điều này không tốt hơn là lật một đồng xu. Trong trường hợp này, xác suất sau của chiếc xe có màu xanh đơn giản bằng với xác suất trước đó, bởi vì câu trả lời của mọi người không cho chúng ta biết điều gì. Nhưng chắc chắn mọi người làm tốt hơn ít nhất một chút so với điều đó, và ngay cả khi chúng tôi nói rằng mọi người chỉ chính xác 51% thời gian, tỷ lệ khả năng vẫn hoạt động sao cho nó có khả năng cao hơn gấp có màu xanh1013

Đây là tất cả kết quả của những con số khá lớn mà bạn đã chọn trong ví dụ của mình. Nếu có 9/10 người nói rằng chiếc xe có màu xanh, thì đó sẽ là một câu chuyện rất khác, mặc dù cùng một tỷ lệ người ở trong một trại so với bên kia. Bởi vì bằng chứng thống kê không phụ thuộc vào tỷ lệ này, mà phụ thuộc vào sự khác biệt về số giữa các phe phái đối lập. Trên thực tế, trong tỷ lệ khả năng (định lượng bằng chứng), 100 người nói rằng chiếc xe không có màu xanh chính xác hủy 100 trong số 900 người nói rằng nó có màu xanh, vì vậy giống như bạn có 800 người đồng ý nó màu xanh Và đó rõ ràng là bằng chứng khá rõ ràng.

(Chỉnh sửa: Như Silverfish đã chỉ ra , các giả định tôi đưa ra ở đây thực sự ngụ ý rằng bất cứ khi nào một người mô tả một chiếc xe không màu xanh không chính xác, họ sẽ mặc định nói đó là màu xanh. Tất nhiên điều này không thực tế bởi vì họ thực sự có thể nói bất kỳ màu nào và sẽ chỉ nói màu xanh đôi khi. Điều này không có gì khác biệt với kết luận, vì mọi người càng ít nhầm lẫn một chiếc xe không màu xanh với một chiếc màu xanh, bằng chứng mạnh mẽ hơn là màu xanh khi họ nói nó là vậy. Nếu có bất cứ điều gì, những con số đưa ra ở trên thực tế chỉ là giới hạn dưới của bằng chứng thân xanh.)


11
+1. Trên thực tế, với dữ liệu của OP, ước tính MLE về tần suất mọi người chính xác là 900/1000 = 90%.
amip

5
Lấy màu xe đúng 50% thời gian không giống như lật một đồng xu. Rốt cuộc, có nhiều hơn chỉ là hai màu có sẵn. Ngoài ra, có thể một số người nói "hải quân" hoặc "phương vị" thay vì "màu xanh"? Trên thực tế, người dân sẽ không nói sai "màu xanh" khi câu trả lời đúng sẽ là "một số màu được cấp bằng sáng chế và thời trang gần giống như màu xanh"
Hagen von Eitzen

10
Tôi biết đây chỉ là những số liệu minh họa, nhưng nếu "xác suất mà mọi người đánh giá màu xe chính xác là 0,9" thì trừ khi có điều gì đó đặc biệt về màu xanh lam, tôi không nghĩ là hợp lý khi yêu cầu p (nói màu xanh lam | xe không phải màu xanh) = 0,1. Nếu chúng ta nghĩ rằng 90% thời gian, mọi người xác định màu chính xác, thì p (nói đỏ | xe là đỏ) = p (nói trắng | xe là trắng) = p (nói xanh | xe là xanh) = 0,9 và như vậy trên cho tất cả các màu xe có thể. Nhưng tại sao p (nói màu xanh | xe là màu đỏ) = p (nói màu xanh | xe là màu trắng) = p (nói màu xanh | xe là màu xanh lá cây) = 0,1? Điều này có nghĩa là p (giả sử màu trắng | xe là màu đỏ) = 0.
Cá bạc

2
@PatMolloy: Không nhất thiết. Nó phụ thuộc vào việc xác suất có đối xứng hay không: có khả năng ai đó nhầm màu xanh dương với một chiếc xe không màu xanh không, vì có ai đó nhầm một chiếc xe không màu xanh với một chiếc xe màu xanh không? Nếu vậy, thì bản án 500/500 cung cấp chính xác nhiều thông tin như một lần tung đồng xu. Nhưng nếu mọi người ít nói rằng một chiếc xe không màu xanh là màu xanh lam, thì họ sẽ nói rằng một chiếc xe màu xanh không phải là màu xanh, thì 500 người nói màu xanh khó giải thích hơn so với 500 người không nói màu xanh, dưới giả thuyết không màu xanh. Vì vậy, trong trường hợp đó, sự cân bằng của bằng chứng sẽ nghiêng về màu xanh.
Ruben van Bergen

3
Nhận thức màu sắc là một điều khó khăn .. nếu chín trong số mười người nói rằng một chiếc váy là màu trắng và vàng, thì xác suất đó là màu xanh và đen?
Glen_b

73

Câu trả lời đúng phụ thuộc vào thông tin không được chỉ định trong vấn đề, bạn sẽ phải đưa ra một số giả định khác để rút ra một câu trả lời dứt khoát duy nhất:

  • Xác suất trước đó chiếc xe có màu xanh, tức là bạn tin rằng chiếc xe có màu xanh mà bạn chưa hỏi ai.
  • Xác suất ai đó nói với bạn chiếc xe có màu xanh khi nó thực sự màu xanh và xác suất họ nói với bạn chiếc xe có màu xanh khi nó thực sự không có màu xanh.
  • Xác suất chiếc xe thực sự có màu xanh khi ai đó nói nó là, và xác suất chiếc xe không có màu xanh, khi ai đó nói nó có màu xanh.

Với những thông tin này, chúng ta có thể chia nhỏ toàn bộ công thức của Bayes để đưa ra xác suất hậu nghiệm rằng chiếc xe có màu xanh. Tôi sẽ tập trung vào trường hợp chúng tôi chỉ hỏi một người, nhưng lý do tương tự có thể được áp dụng cho trường hợp bạn hỏi người.1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

Chúng ta cần tiếp tục phân tích thêm , đây là nơi ưu tiên xuất hiện:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

Vì vậy, hai ứng dụng của quy tắc Bayes đưa bạn đến đó. Bạn sẽ cần xác định các tham số không xác định dựa trên thông tin bạn có về tình huống cụ thể hoặc bằng cách đưa ra một số giả định hợp lý.

Có một số kết hợp khác về những giả định bạn có thể thực hiện, dựa trên:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

Ngay từ đầu, bạn không biết bất kỳ điều gì trong số này. Vì vậy, bạn phải đưa ra một số giả định hợp lý về ba trong số chúng, và sau đó thứ tư được xác định từ đó.


5
Đó thường là trường hợp. Sau đó, bạn có hai lựa chọn, thể hiện sự thiếu hiểu biết của bạn bằng cách giả sử màu xanh lam và không phải màu xanh có khả năng như nhau. Thực hiện một cuộc khảo sát nhanh về lĩnh vực này, một cái gì đó như thế này có thể giúp: en.wikipedia.org/wiki/Car_colour_p Phổ biến
Matthew Drury

18
@Matthew vấn đề với "màu xanh và không phải màu xanh là có khả năng như nhau" là nó không nhất quán; nếu chúng ta áp dụng cùng một lý do cho từng màu xe có thể, chúng ta sẽ tuyên bố rằng tất cả chúng đồng thời có 50% cơ hội (không thể có nhiều hơn hai màu theo luật xác suất) và ít hơn 50% cơ hội (khi bạn nhìn màu xanh lam trong "không phải màu trắng" và "không phải màu đỏ", điều này cũng dẫn đến mâu thuẫn vì xác suất của bất kỳ màu nào không thể có nhiều giá trị)
Glen_b

2
Có nhiều thông tin không xác định hơn thông tin này bởi vì câu trả lời của mọi người không cần phải độc lập (thực tế, chúng tôi hy vọng rằng chúng có mối tương quan chặt chẽ với màu sắc khách quan, do đó không phải là độc lập). Điều gì xảy ra nếu câu trả lời phụ thuộc "quá mức"? Nói, chúng tôi chỉ đơn giản là hỏi mười người đi bộ ngẫu nhiên, nhưng mỗi người trong số họ trả lời 100 lần?
Hagen von Eitzen

2
P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)

15
@Glen_b: Trên thế giới chỉ có hai màu, xanh dương và không xanh. Phải thừa nhận rằng cả hai đều có nhiều sắc thái khác nhau, đặc biệt là không có màu xanh.
psmears

13

Có một giả định quan trọng rằng 1000 ý kiến ​​của bạn không chia sẻ thành kiến ​​hệ thống. Đây là một giả định hợp lý ở đây, nhưng có thể quan trọng trong các trường hợp khác.

Ví dụ có thể là:

  • tất cả chúng đều có chung một chứng mù màu (di truyền trong quần thể chẳng hạn),
  • tất cả họ đều nhìn thấy chiếc xe vào ban đêm dưới ánh đèn đường natri màu cam,
  • tất cả họ đều có chung một nền văn hóa trong đó màu xanh là điều cấm kỵ hoặc có liên quan đến phép thuật (điều này thiên vị cho dù họ có mô tả bất kỳ đối tượng nào là màu xanh hay sử dụng một uyển ngữ văn hóa hay bất cứ điều gì thay vào đó),
  • tất cả họ đều được nói (hoặc chia sẻ một niềm tin chung) rằng nếu họ làm / không trả lời một cách cụ thể nào đó, điều gì đó tốt / xấu sẽ xảy ra với họ .....

Nó không có khả năng trong trường hợp này nhưng đó là một giả định đáng kể ngụ ý trong các trường hợp khác. Nó cũng không phải là cực đoan - chuyển câu hỏi của bạn sang một số tên miền khác và đây sẽ là một yếu tố thực sự.

Ví dụ cho mỗi câu trả lời của bạn có thể bị ảnh hưởng bởi xu hướng chia sẻ:

  • Hãy hỏi nếu một ly cao mỏng chứa nhiều hơn một ly béo ngắn thực sự giống hệt nhau, nhưng 1000 người được hỏi của bạn là những đứa trẻ rất nhỏ (chia sẻ sai lầm).
  • Hỏi 1000 người nếu đi dưới thang có nguy hiểm không (niềm tin văn hóa chung)
  • Hỏi 1000 người đã kết hôn nếu họ yêu bạn đời của họ / đã ngoại tình, trong trường hợp họ tin rằng đối tác của họ sẽ biết câu trả lời của họ. Bối cảnh có thể là một chương trình truyền hình, hoặc đối tác có mặt khi được hỏi vv (niềm tin chung về hậu quả)

Sẽ không khó để tưởng tượng một số câu hỏi giống hệt nhau về mặt cấu trúc trong đó câu trả lời 900: 100 là thước đo niềm tin và sự trung thực, hoặc một cái gì đó khác, và không chỉ ra câu trả lời đúng. Không có khả năng trong trường hợp này nhưng trong các trường hợp khác - có.


11

Một lý do bạn nhận được câu trả lời khác nhau từ những người khác nhau là câu hỏi có thể được diễn giải theo nhiều cách khác nhau và không rõ ý của bạn là "xác suất" ở đây. Một cách để hiểu ý nghĩa của câu hỏi là phân công các linh mục và lý do sử dụng quy tắc của Bayes như trong câu trả lời của Matthew.

Trước khi yêu cầu xác suất, bạn phải quyết định những gì được mô hình hóa là ngẫu nhiên và những gì không. Nó không được chấp nhận phổ biến rằng số lượng cố định nhưng không xác định nên được chỉ định linh mục. Đây là một thử nghiệm tương tự với bạn làm nổi bật vấn đề với câu hỏi:

Xii=1,,1000p=0.5Xii=11000Xi=900

pp


1
Vì vậy, nếu bạn loại bỏ giả định rằng chiếc xe có màu xanh và phần còn lại là như nhau, 900 người nói là màu xanh và 100 nói là không, trong trường hợp đó xác suất sẽ là 0,9?
người dùng

Không, nó gần hơn rất nhiều với 1. Rất, rất ít khả năng 900 trong số 1000 người sẽ bị sai màu.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.điều này không tương ứng với cách hiểu về "xác suất" như tôi đã quen thuộc với nó. Nghe có vẻ giống như "X có thể xảy ra hoặc không thể xảy ra, vì vậy xác suất phải là 50%". Bạn có thể nói rõ hơn một chút về ý của bạn không?
AnoE

2
@AnoE sự phân biệt tương tự như giữa các tham số và các biến ngẫu nhiên. Nó được đưa ra trong bối cảnh của câu hỏi rằng chiếc xe dành cho màu xanh thật, màu của nó không phải là kết quả của một thí nghiệm ngẫu nhiên. Nó thực chất là một sự giải thích thường xuyên v. Bayesian. Nếu bạn lật một đồng xu 1000 lần và quan sát 900 đầu, thì xác suất để đồng tiền đó là công bằng là bao nhiêu? Đó là một hoặc không nếu bạn là người thường xuyên (hoặc vô nghĩa); chúng tôi không chỉ định xác suất cho các tham số.
ekvall

@user Không, tôi đã cập nhật câu trả lời để làm cho quan điểm của tôi rõ ràng hơn.
ekvall

7

Câu trả lời thực tế đơn giản:

Xác suất có thể dễ dàng dao động từ 0% đến 100% tùy theo giả định của bạn

Mặc dù tôi thực sự thích các câu trả lời hiện có, nhưng trong thực tế, về cơ bản, nó tập trung vào hai tình huống đơn giản sau:

Kịch bản 1: Mọi người được cho là rất giỏi trong việc nhận ra màu xanh khi nó có màu xanh ... 0%

Trong trường hợp này, có rất nhiều người nói rằng chiếc xe không có màu xanh, rất khó có khả năng chiếc xe thực sự có màu xanh. Do đó, xác suất tiếp cận 0%.

Kịch bản 2: Mọi người được cho là rất giỏi trong việc nhận ra không phải màu xanh khi nó không có màu xanh ... 100%

Trong trường hợp này, có rất nhiều người nói rằng chiếc xe có màu xanh, rất có khả năng nó thực sự là màu xanh. Do đó xác suất tiếp cận 100%.


Tất nhiên đến từ góc độ toán học này, bạn sẽ bắt đầu bằng một cái gì đó chung chung như 'chúng ta hãy giả sử rằng các xác suất có liên quan là ...', điều này khá vô nghĩa vì những điều như vậy thường không được biết đến trong bất kỳ trường hợp ngẫu nhiên nào. Do đó, tôi ủng hộ việc xem xét các thái cực để nắm bắt ý tưởng rằng cả hai tỷ lệ phần trăm có thể dễ dàng được chứng minh bằng các giả định đơn giản và thực tế, và do đó không có câu trả lời có ý nghĩa duy nhất.


2
Nếu "mọi người được cho là rất giỏi nhận ra màu xanh", tại sao họ lại ước tính nó có màu xanh khi nó không nằm trong kịch bản 1? Bạn có thể muốn thể hiện các tình huống của mình dưới dạng tích cực sai và phủ định sai.
hyde

@hyde Thưởng các kịch bản để xóa bỏ sự mơ hồ
Dennis Jaheruddin


5

Bạn cần phát triển một số khung dự toán. Một số câu hỏi bạn có thể hỏi là

  1. Có bao nhiêu màu? Có phải chúng ta đang nói chuyện hai màu? Hoặc tất cả các màu sắc của cầu vồng?

  2. Làm thế nào khác biệt là màu sắc? Có phải chúng ta đang nói chuyện màu xanh và màu cam? Hoặc màu xanh, màu lục lam và màu ngọc lam?

  3. Màu xanh có nghĩa là gì? Có màu lục lam và / hoặc xanh ngọc? Hay chỉ là màu xanh?

  4. Làm thế nào tốt là những người ước tính màu sắc? Có phải tất cả họ đều là nhà thiết kế đồ họa? Hay họ bị mù màu?

Từ quan điểm thống kê thuần túy, chúng ta có thể đưa ra một số dự đoán cho đến cuối cùng. Đầu tiên, chúng tôi biết rằng ít nhất 10% số người đang chọn một phản hồi không chính xác. Nếu chỉ có hai màu (từ câu hỏi đầu tiên), thì chúng ta có thể nói rằng có

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Như một kiểm tra nhanh, nếu chúng ta cộng những thứ đó lại với nhau, chúng ta sẽ nhận được 100%. Bạn có thể thấy một ký hiệu toán học hơn về điều này tại câu trả lời @MatthewDrury .

Làm thế nào để chúng ta có được 90% trong phần ba? Có bao nhiêu người nói màu xanh nhưng đã sai nếu không. Bởi vì chỉ có hai màu, đây là những màu đối xứng. Nếu có nhiều hơn hai màu, thì khả năng lựa chọn sai là màu xanh khi họ nói điều gì đó khác sẽ thấp hơn.

Dù sao, phương pháp ước tính này cho chúng ta 90% màu xanh. Điều này bao gồm 81% cơ hội mọi người nói màu xanh khi đó và 9% cơ hội mọi người nói rằng đó không phải là khi nó xảy ra. Đây có lẽ là lần gần nhất chúng ta có thể trả lời câu hỏi ban đầu và nó đòi hỏi chúng ta phải dựa vào dữ liệu để ước tính hai điều khác nhau. Và giả sử rằng cơ hội màu xanh được chọn cũng giống như cơ hội màu xanh là chính xác.

Nếu có nhiều hơn hai màu, thì logic sẽ thay đổi một chút. Hai dòng đầu tiên giữ nguyên, nhưng chúng ta mất tính đối xứng trong hai dòng cuối cùng. Trong trường hợp đó, chúng tôi cần thêm đầu vào. Chúng tôi có thể ước tính một cách có thể ước tính cơ hội nói chính xác màu xanh là 81% một lần nữa, nhưng chúng tôi không biết cơ hội nào là màu đó là màu xanh khi ai đó nói rằng nó không phải.

Chúng tôi cũng có thể cải thiện ngay cả hai ước tính màu. Với số lượng xe có ý nghĩa thống kê của mỗi màu, chúng ta có thể có số lượng người có ý nghĩa thống kê và phân loại chúng. Sau đó, chúng ta có thể đếm tần suất mọi người đúng khi họ đưa ra từng lựa chọn màu sắc và tần suất họ phù hợp với từng lựa chọn màu. Sau đó, chúng tôi có thể ước tính chính xác hơn sự lựa chọn thực tế của mọi người.

Bạn có thể hỏi làm thế nào 90% có thể sai. Hãy xem xét những gì xảy ra nếu có ba màu: xanh dương, xanh lam và sapphire. Ai đó có thể hợp lý coi cả ba trong số này là màu xanh. Nhưng chúng tôi muốn nhiều hơn nữa. Chúng tôi muốn bóng chính xác. Nhưng ai còn nhớ tên của các sắc thái khác? Nhiều người có thể đoán màu xanh lam vì đó là màu phù hợp duy nhất mà họ biết. Và vẫn sai khi hóa ra là thiên thanh.


Như đã đề cập trong một trong những ý kiến ​​trước đó, chắc chắn hai màu duy nhất có liên quan là 'xanh dương' và 'không phải màu xanh' do đó không cần thiết phải có nhiều màu sắc.
Dennis Jaheruddin

4

Một xác suất chính xác, toán học, đúng / sai không thể được tính toán với thông tin bạn cung cấp.

Tuy nhiên, trong cuộc sống thực, thông tin như vậy không bao giờ có sẵn một cách chắc chắn. Do đó, bằng cách sử dụng trực giác của chúng tôi (và tất cả số tiền của tôi sẽ đi nếu chúng tôi đặt cược), chiếc xe chắc chắn có màu xanh. (một số người tin rằng đây không còn là thống kê nữa, nhưng tốt, quan điểm khoa học đen / trắng không hữu ích lắm)

Lý do rất đơn giản. Giả sử xe không có màu xanh. Sau đó 90% người dân (!) Đã sai. Họ chỉ có thể sai vì một danh sách các vấn đề bao gồm:

  • mù màu
  • nói dối bệnh lý
  • chịu ảnh hưởng của các chất như rượu, LCD, v.v.
  • không hiểu câu hỏi
  • một dạng rối loạn tâm thần khác
  • sự kết hợp của những điều trên

Vì những điều trên rõ ràng không có khả năng ảnh hưởng đến 90% dân số ngẫu nhiên trung bình (ví dụ mù màu ảnh hưởng đến khoảng 8% nam giới và 0,6% nữ giới, đó là 43 người trong số 1000 người), nên chắc chắn đó là trường hợp xe hơi màu xanh da trời. (Đó là tất cả tiền của tôi sẽ đi dù sao).


Điều này có vẻ trực giác đúng với tôi. Tôi nghĩ rằng những lời chỉ trích của câu hỏi ban đầu là không cung cấp đủ thông tin và những giả định nhất định phải được đưa ra .. tốt, không phải hầu như luôn luôn như vậy trong thế giới thực ???
Pat Molloy

@PatMolloy Nó không cung cấp đủ thông tin để cung cấp một câu trả lời toán học tinh vi đúng / sai chính xác (đó chắc chắn là điều mà nhiều câu hỏi nhắm đến từ trang web này). Tuy nhiên, với các thông tin giảm mà bạn đã cung cấp, khi nói đến tiền cá cược, đây là câu trả lời (100%) mọi người sẽ chọn.
luchonacho

1
Tôi nghĩ rằng bạn đã thất bại trong việc đưa ra một số lựa chọn thay thế hợp lý nhất - đó là những lựa chọn phải khiến bạn phải sửa đổi kết luận của mình. Chúng bao gồm (a) mọi người không thể nhận ra màu xanh; (b) không có sự hiểu biết chung về "màu xanh" giữa người hỏi và người trả lời; (c) ý nghĩa "khoa học" của "màu xanh" khác với những gì mọi người thường hiểu là "màu xanh". Điều quan trọng, bởi vì bạn không thể định lượng bất kỳ lựa chọn thay thế nào, cũng như hầu hết những lựa chọn bạn liệt kê, làm thế nào bạn có thể biện minh cho việc xác định xác suất của câu trả lời? Đó không phải là thống kê!
whuber

"Vì những điều trên rõ ràng không có khả năng ảnh hưởng đến 90% dân số ngẫu nhiên trung bình" Đừng quá chắc chắn về điều đó. Hãy nhớ rằng chúng ta thường nói về mặt trung bình khi thảo luận về con người. Vì vậy, chắc chắn, chỉ có một vài phần trăm bị mù màu (so với mức trung bình), nhưng có thể có một số ít người có tầm nhìn vượt trội, ví dụ như tetrachromats.
NPSF3000

2
Tôi luôn chịu ảnh hưởng của LCD
Alex

2

Tôi sẽ không ăn phân dựa trên thực tế là hàng tỷ con ruồi không thể sai. Có thể có hàng tá lý do khác khiến 900 trong số 1000 người có thể bị lừa khi nghĩ rằng chiếc xe có màu xanh. Rốt cuộc, đó là cơ sở của những trò ảo thuật, dụ dỗ mọi người nghĩ về một cái gì đó loại bỏ khỏi thực tế. Nếu 900 người trong số 1000 người nhìn thấy một pháp sư đâm trợ lý của mình, họ sẽ nhanh chóng trả lời trợ lý bị đâm, vì một vụ giết người không thể xảy ra trên sân khấu. Một ánh sáng màu xanh trên sơn xe phản chiếu, bất cứ ai?


2

Người được hỏi biết quá ít về cách thức cuộc thăm dò được thực hiện để trả lời chính xác câu hỏi. Theo như anh ấy quan tâm, cuộc thăm dò ý kiến ​​có thể gặp phải một số vấn đề:

Những người tham gia cuộc thăm dò ý kiến ​​có thể bị thiên vị:

  1. Chiếc xe trông có vẻ màu xanh vì ảo ảnh quang học .

  2. Màu sắc của chiếc xe là vì một số lý do khó quan sát, và mọi người vì lý do nào đó đã được hiển thị rất nhiều chiếc xe màu xanh trước chiếc này, khiến hầu hết trong số họ tin rằng chiếc xe này có lẽ cũng màu xanh.

  3. Bạn đã trả tiền cho họ để nói rằng chiếc xe có màu xanh.

  4. Bạn đã có người thôi miên tất cả bọn họ tin rằng chiếc xe có màu xanh.

  5. Họ đã lập một hiệp ước để nói dối và phá hoại cuộc thăm dò.

Có thể có mối tương quan giữa những người tham gia cuộc thăm dò vì cách họ được chọn hoặc vì họ ảnh hưởng lẫn nhau:

  1. Bạn đã vô tình thực hiện cuộc thăm dò tại một cuộc họp đại chúng cho những người bị mù màu tương tự.

  2. Bạn đã thực hiện cuộc thăm dò tại trường mẫu giáo; Các cô gái không hứng thú với chiếc xe và hầu hết các chàng trai đều có màu xanh lam là màu yêu thích của họ, khiến họ tưởng tượng rằng chiếc xe có màu xanh.

  3. Người đầu tiên cho thấy chiếc xe đã say và nghĩ rằng nó trông có màu xanh, hét lên "NÓ LÀ MÀU XANH", ảnh hưởng đến mọi người khác nghĩ rằng chiếc xe có màu xanh.

Vì vậy, trong khi xác suất chiếc xe có màu xanh nếu cuộc thăm dò được thực hiện hoàn toàn chính xác là rất cao (như đã giải thích trong câu trả lời của Ruben van Bergen), độ tin cậy của cuộc thăm dò có thể đã bị tổn hại khiến cho khả năng chiếc xe không có màu xanh tầm thường. Người được hỏi ước tính cơ hội này lớn đến mức nào cuối cùng phụ thuộc vào ước tính của anh ta về khả năng tình huống xảy ra với cuộc thăm dò ý kiến ​​và mức độ bạn thực hiện các cuộc thăm dò ý kiến ​​(và anh ta nghĩ bạn tinh nghịch đến mức nào).


2

Định nghĩa của "màu xanh" là gì?

Các nền văn hóa và ngôn ngữ khác nhau có các quan niệm khác nhau về màu xanh. IIRC, một số nền văn hóa bao gồm màu xanh lá cây trong quan niệm của họ về màu xanh!

Giống như bất kỳ từ ngôn ngữ tự nhiên nào, bạn chỉ có thể giả sử có một số quy ước văn hóa về thời điểm (và khi không) để gọi mọi thứ là "màu xanh".

Nhìn chung, màu sắc trong ngôn ngữ là chủ quan đáng ngạc nhiên (liên kết từ các ý kiến ​​dưới đây, cảm ơn @Count Ibilis)

nhập mô tả hình ảnh ở đây


7
Trong bối cảnh của câu hỏi, tôi tin rằng khía cạnh đặc biệt này khá không liên quan - tôi cho rằng OP đã chọn từ "màu xanh" là một thuật ngữ rất chung chung và không phải là một cái gì đó như "azure", "torqouise", v.v ... nơi mọi người có thể không chắc chắn. Ngoài ra, xe hơi thường có xu hướng sử dụng bảng màu rất hạn chế về màu sắc có thể / thông thường. Cuối cùng, câu hỏi không phải là "tại sao 100 người nói không phải màu xanh", mà là "xác suất mà chiếc xe thực sự có màu xanh".
AnoE


Một định nghĩa chính xác sẽ là "phát ra ánh sáng chủ yếu có bước sóng là 475nm plusminus ~ 10-20nm trong điều kiện môi trường hiện tại". Điều này thường được chấp nhận là màu xanh.
rackandboneman

Có, nhưng có bao nhiêu người mang theo một công cụ để đo bước sóng chiếm ưu thế? Bạn cũng quên loại trừ các bước sóng không nhìn thấy được.
Anony-Mousse

1
Câu hỏi dường như là về việc sử dụng một nhóm người không xác định được thống kê dưới dạng máy đo bước sóng :)
rackandboneman

1

Khả năng có thể, tùy thuộc vào các điều kiện tiên quyết tinh tế hơn, là một vài giá trị khác nhau, nhưng 99,995% là giá trị có ý nghĩa nhất đối với tôi.

Theo định nghĩa, chúng ta biết rằng chiếc xe có màu xanh lam (đó là 100%), nhưng nó không được chỉ định rõ điều này thực sự có nghĩa là gì (điều đó sẽ đặt cược phần nào triết học). Tôi sẽ cho rằng một cái gì đó là màu xanh trong một ý nghĩa có thể thực sự được nhìn thấy như màu xanh.

Chúng tôi cũng biết rằng 90% đối tượng thử nghiệm đã báo cáo nó là màu xanh.

Chúng tôi không biết những gì đã được hỏi hoặc đánh giá được thực hiện như thế nào và điều kiện ánh sáng của chiếc xe. Được yêu cầu đặt tên màu, một số đối tượng có thể đã nói "màu xanh lục" do điều kiện ánh sáng, và người đánh giá có thể không được tính là "màu xanh". Những người tương tự có thể đã trả lời "có" nếu câu hỏi là "Đây có phải là màu xanh không?". Tôi sẽ cho rằng bạn không có ý định lừa đảo ác ý đối tượng thử nghiệm của mình.

Chúng tôi biết rằng tỷ lệ của tritanopy là khoảng 0,005%, điều đó có nghĩa là nếu chiếc xe thực sự có thể được xem là màu xanh lam , thì 99,995% đối tượng thử nghiệm thực sự đã nhìn thấy màu sắc là màu xanh lam. Tuy nhiên, điều đó có nghĩa là 9,995% đối tượng thử nghiệm không báo cáo màu xanh khi họ thấy rõ màu xanh. Họ đã nói dối về những gì họ thấy. Điều này gần với những gì kinh nghiệm cuộc sống của bạn cũng nói với bạn: mọi người không phải lúc nào cũng trung thực (nhưng, trừ khi có một động lực, họ thường như vậy).

Do đó, người không quan sát có thể cho rằng với chứng nhận áp đảo rằng chiếc xe có màu xanh. Đó sẽ là 100%

Ngoại trừ ... ngoại trừ nếu bản thân người không quan sát phải chịu cảnh tượng, trong trường hợp đó, cô sẽ không thấy chiếc xe có màu xanh mặc dù mọi người khác (hay đúng hơn là 90% trong số họ) nói như vậy. Ở đây, nó trở nên triết lý một lần nữa: Nếu mọi người khác nghe thấy một cái cây rơi, nhưng tôi đã không, nó đã rơi?

Tôi dám khẳng định rằng câu trả lời thực tế, hợp lý nhất sẽ là: Nếu người không quan sát tình cờ là trianope (0,005% cơ hội), thì xác minh xem màu dự đoán và màu thực như nhìn thấy có giống nhau không. Do đó, khả năng là 99,995% chứ không phải 100%.

Hơn nữa, như một phần thưởng, vì chúng tôi phát hiện ra rằng 9,995% đối tượng thử nghiệm là kẻ nói dối và được biết rằng tất cả người Cretan đều là kẻ nói dối , chúng tôi có thể kết luận rằng chúng tôi không ở đảo Crete!


1

Bạn có một chiếc xe màu xanh (theo một số biện pháp khoa học khách quan - đó là màu xanh).

...

"Xác suất mà chiếc xe có màu xanh là gì?"

Nó có màu xanh 100%.

Tất cả những gì họ biết là 900 người nói rằng nó có màu xanh và 100 người thì không. Bạn không biết gì thêm về những người này (1000).

Sử dụng những con số này (không có bất kỳ bối cảnh nào ) là hoàn toàn vô nghĩa. Tất cả sôi sục để giải thích cá nhân của câu hỏi. Chúng ta không nên đi theo con đường này và sử dụng Wittgenstein: "Wovon man nicht spechen kann, darüber muss man schweigen."


Hãy tưởng tượng câu hỏi sau đây để so sánh:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Điều này về cơ bản là cùng một vấn đề (ít thông tin), nhưng rõ ràng hơn nhiều là những gì chúng ta nghĩ về màu sắc của chiếc xe chủ yếu là (nếu không hoàn toàn) hoàn cảnh.


Về lâu dài, khi chúng tôi nhận được nhiều câu hỏi liên quan, thì chúng tôi có thể bắt đầu đoán câu trả lời cho những câu hỏi không hoàn chỉnh như vậy. Điều này cũng tương tự đối với thuật toán ăn miếng trả miếng không hoạt động trong một trường hợp duy nhất, nhưng nó hoạt động trong thời gian dài . Theo nghĩa tương tự, Wittgenstein đã trở lại từ công việc trước đây với Điều tra viên chính của mình . Chúng tôi có thể trả lời những câu hỏi này, nhưng chúng tôi cần thêm thông tin / thử nghiệm / câu hỏi. Đó là một quá trình.


0

Nếu chúng ta cho rằng chiếc xe có màu xanh lam, thì 100 trong số 1.000 nói rằng nó không phải màu xanh ngụ ý một kiểu mẫu cực đoan nào đó. Có lẽ bạn chỉ lấy mẫu người mù màu. Nếu chúng ta cho rằng chiếc xe không có màu xanh, thì độ lệch mẫu thậm chí còn tồi tệ hơn. Vì vậy, tất cả những gì chúng ta có thể kết luận từ dữ liệu được đưa ra là mẫu rất sai lệch và vì chúng ta không biết nó bị sai lệch như thế nào, chúng ta không thể kết luận bất cứ điều gì về màu sắc của chiếc xe.


Umm, chắc chắn rằng 900 người nói rằng nó có màu xanh là tốt cho một cái gì đó? Chúng ta không thể kết luận nó có nhiều khả năng là màu xanh hơn không ?? Hãy nhớ rằng người trả lời chỉ biết các số 900 và 100. Vì vậy, họ thực sự có thể nói bất cứ điều gì về thiên vị?
Pat Molloy

0

Đã có một số câu trả lời. Tôi không có nghĩa là một bậc thầy toán học, nhưng tốt, đây là của tôi.

Chỉ có thể có 4 khả năng:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Từ câu hỏi, bạn biết rằng tổng của trường hợp 1 và trường hợp 4 là 900 người (90%), và tổng của trường hợp 2 và trường hợp 3 là 100 người (10%). Tuy nhiên, đây là một nhược điểm: điều bạn không biết là sự phân phối trong 2 cặp trường hợp này. Có thể tổng của trường hợp 1 và 4 hoàn toàn được tạo thành từ trường hợp 1 (có nghĩa là xe có màu xanh) hoặc có lẽ toàn bộ tổng được tạo thành từ trường hợp 4 (có nghĩa là xe không có màu xanh). Tương tự với tổng của trường hợp 2 + 3. Vì vậy, ... Những gì bạn cần là đưa ra một số cách để dự đoán phân phối trong các trường hợp tổng hợp. Không có dấu hiệu nào khác trong câu hỏi (không có nơi nào nói rằng mọi người chắc chắn 80% để biết màu sắc của họ hoặc bất cứ điều gì tương tự), không có cách nào bạn có thể đưa ra một câu trả lời chắc chắn.

Đã nói điều này ... tôi nghi ngờ câu trả lời dự kiến ​​là một cái gì đó dọc theo dòng:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

50% còn lại đơn giản là không xác định, gọi nó là lề lỗi.


0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}


-3

Người không thể nhìn thấy chiếc xe không biết nó được khoa học chứng minh là màu xanh. Xác suất để anh ấy / cô ấy rằng chiếc xe có màu xanh là 50/50 (nó có màu xanh hoặc không). Thăm dò ý kiến ​​người khác có thể ảnh hưởng đến ý kiến ​​của người này nhưng điều đó không làm thay đổi khả năng một chiếc xe không nhìn thấy có màu xanh hoặc không.

Tất cả các phép toán trên xác định xác suất mà tập mẫu của bạn có thể xác định nếu nó có màu xanh.


Tôi không chắc chắn đúng là xác suất nó có màu xanh là 50/50. Trong thực tế, nó là cách ít hơn 50, vì nó có thể là màu đỏ, trắng, vàng, v.v ... Xác suất mà một chiếc xe được chọn ngẫu nhiên là màu xanh là ít hơn 50%.
người dùng
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.