Là kết quả của một kỳ thi là một nhị thức?


31

Đây là một câu hỏi thống kê đơn giản tôi đã được đưa ra. Tôi không thực sự chắc chắn tôi hiểu nó.

X = số điểm đạt được trong một bài kiểm tra (nhiều lựa chọn và câu trả lời đúng là một điểm). Là nhị thức X được phân phối?

Câu trả lời của giáo sư là:

Có, bởi vì chỉ có câu trả lời đúng hoặc sai.

Câu trả lời của tôi:

Không, bởi vì mỗi câu hỏi có một "xác suất thành công" khác nhau. Như tôi đã hiểu, phân phối nhị thức chỉ là một chuỗi các thí nghiệm Bernoulli, mỗi thí nghiệm đều có kết quả đơn giản (thành công hay thất bại) với p xác suất thành công nhất định (và tất cả đều "giống hệt nhau" về p). Ví dụ: Lật một đồng xu (công bằng) 100 lần, đây là 100 thí nghiệm Bernoulli và tất cả đều có p = 0,5. Nhưng ở đây các câu hỏi có các loại p khác nhau phải không?


14
+1 Thậm chí nhiều hơn: trừ khi đây thực sự là một bài kiểm tra kỳ lạ, các câu trả lời cho các câu hỏi sẽ có mối tương quan mạnh mẽ. Nếu là tổng số điểm cho một cá nhân, điều này sẽ loại trừ phân phối Binomial. Có thể câu hỏi đang hoạt động theo một giả định "giả thuyết không" trong đó tất cả các kiểm tra là độc lập và đoán ngẫu nhiên tất cả các câu trả lời? X
whuber

2
Thật nghịch lý, tôi ít nhất sẽ vận động cho tín dụng một phần về điều này, nhưng "câu trả lời" dường như phản ánh sự không phù hợp để trao giải đó :) (Tôi nghĩ bạn đang ở đây).
AdamO

1
Vâng, cảm ơn bạn: D, tôi nghĩ rằng đó là một phân phối nhị thức Poisson (nếu có)
Paul


2
Tôi đồng ý với mọi người rằng câu hỏi này rất kém, nhưng có một vấn đề đóng khung ở đây. Nếu đây là một khóa học cơ bản và nó là một định dạng câu trả lời ngắn (để bạn có cơ hội giải thích lý do của mình), tôi sẽ nói câu trả lời tốt nhất có lẽ là "có (giả sử tính độc lập và độ khó tương đương cho mỗi câu hỏi)"; điều đó sẽ báo hiệu cho giáo sư rằng (1) bạn hiểu những hạn chế của câu hỏi và (2) bạn không cố gắng trở thành một người thông minh.
Ben Bolker

Câu trả lời:


25

Tôi đồng ý với câu trả lời của bạn. Thông thường loại dữ liệu này ngày nay sẽ được mô hình hóa bằng một số loại mô hình Lý thuyết đáp ứng vật phẩm . Ví dụ: nếu bạn đã sử dụng mô hình Rasch , thì câu trả lời nhị phân sẽ được mô hình hóa thànhXni

Pr{Xni=1}=eβnδi1+eβnδi

nơi có thể được coi như n Khả năng người -thứ và delta i như tôi -thứ khó khăn câu hỏi. Vì vậy, mô hình cho phép bạn nắm bắt thực tế rằng những người khác nhau khác nhau về khả năng và câu hỏi khác nhau về độ khó và đây là mô hình đơn giản nhất trong các mô hình IRT.βnnδii

Giáo sư trả lời của bạn giả định rằng tất cả các câu hỏi có cùng khả năng "thành công" và là độc lập, kể từ nhị thức là một bản phân phối của một tổng của IID thử nghiệm Bernoulli. Nó bỏ qua hai loại phụ thuộc được mô tả ở trên.n

Như đã lưu ý trong các nhận xét, nếu bạn xem phân phối câu trả lời của một người cụ thể (vì vậy bạn không cần phải quan tâm đến sự thay đổi giữa người với người) hoặc câu trả lời của những người khác nhau trên cùng một mục (vì vậy không có giữa- biến thiên vật phẩm), sau đó phân phối sẽ là Poisson-binomial, tức là phân phối tổng của thử nghiệm Bernoulli không iid. Phân phối có thể xấp xỉ bằng nhị thức, hoặc Poisson, nhưng chỉ vậy thôi. Nếu không, bạn đang thực hiện giả định iid.n

Ngay cả theo giả định "null" về việc đoán, điều này giả định rằng không có mô hình đoán, do đó mọi người không khác nhau về cách họ đoán và các mục không khác nhau về cách họ đoán - vì vậy việc đoán hoàn toàn ngẫu nhiên.


Điều đó có ý nghĩa! Mặc dù tôi đoán bạn có thể tính xác suất xác suất thành công của một câu hỏi nhưng "khả năng con người" nghe có vẻ khó khăn :) Một ý tưởng khác mà tôi có là mô hình hóa này như một tổng của các phân phối bernulli? Ví dụ: giả sử có 2 câu hỏi, do đó 2 xác suất thành công p1 và p2. Tương tự hai biến X1 và X2 đếm (vì vậy 2 bernulli-thí nghiệm). Sau đó, ví dụ xác suất nhận được tổng số điểm là 1 (P1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) p2. Điều đó nghe có hợp lý không?
Paul

2
@Paul tổng của hai Bernoulli với p khác nhau là Poisson-binomial
Tim

4
Giả định "null" về cơ bản là một con bò hình cầu, bạn luôn có thể ngụy biện về chính xác con bò hình cầu như thế nào.
Hồng Ooi

5

Câu trả lời cho vấn đề này phụ thuộc vào việc đóng khung câu hỏi và khi có được thông tin. Nhìn chung, tôi có xu hướng đồng ý với giáo sư nhưng nghĩ rằng lời giải thích về câu trả lời của anh ấy / cô ấy rất kém và câu hỏi của giáo sư nên bao gồm nhiều thông tin hơn ở phía trước.

Nếu bạn xem xét vô số câu hỏi thi tiềm năng và bạn rút ngẫu nhiên một câu hỏi cho câu hỏi 1, hãy rút ra một câu ngẫu nhiên cho câu hỏi 2, v.v. Sau đó, đi vào bài kiểm tra:

  1. Mỗi câu hỏi có hai kết quả (đúng hoặc sai)
  2. Có một số thử nghiệm cố định (câu hỏi)
  3. Mỗi thử nghiệm có thể được coi là độc lập (đi vào câu hỏi hai, xác suất của bạn về việc làm đúng cũng giống như khi đi vào câu hỏi một)p

Trong khuôn khổ này, các giả định của một thí nghiệm nhị thức được đáp ứng.

Than ôi, vấn đề thống kê không được đề xuất là rất phổ biến trong thực tế, không chỉ trong các kỳ thi. Tôi sẽ không ngần ngại bảo vệ lý do của bạn cho giáo sư của bạn.


Jea tôi đoán điều đó cũng đúng. Câu hỏi chỉ là "xấu", vì bạn có thể tranh luận cả hai cách, vì rất ít thông tin được đưa ra. Nhưng tôi rất không hài lòng với câu trả lời của giáo sư.
Paul

4
@Paul, thật khó để viết câu hỏi thống kê tốt. Tôi biết tôi đã làm hỏng nó nhiều lần.
gung - Phục hồi Monica

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Tôi nghĩ bạn nên đưa ra giả định rõ ràng rằng các câu hỏi thi được rút ra độc lập với nhóm câu hỏi tiềm năng. Sẽ thực tế hơn khi chúng tương quan với nhau: nếu câu hỏi 1 dễ, có khả năng bạn đang được làm bài kiểm tra dễ và câu hỏi 2 sẽ dễ.
Adrian

0

Nếu có n câu hỏi và tôi có thể trả lời đúng bất kỳ một câu hỏi nào với xác suất p và có đủ thời gian để trả lời tất cả các câu hỏi và tôi đã thực hiện 100 bài kiểm tra này, thì điểm của tôi sẽ được phân phối bình thường với trung bình là np.

Nhưng không phải tôi lặp lại bài kiểm tra 100 lần, đó là 100 thí sinh khác nhau làm một bài kiểm tra, mỗi bài có xác suất p riêng. Sự phân phối của các p này sẽ là yếu tố ghi đè. Bạn có thể có một bài kiểm tra trong đó p = 0,9 nếu bạn học tốt môn học, p = 0,1 nếu bạn không làm, với rất ít người trong khoảng từ 0,1 đến 0,9. Sự phân bố các điểm sẽ có cực đại rất mạnh ở mức 0,1n và 0,9 n và sẽ không ở đâu gần phân phối bình thường.

Mặt khác, có những bài kiểm tra mà mọi người đều có thể trả lời bất kỳ câu hỏi nào, nhưng mất nhiều thời gian khác nhau, vì vậy một số sẽ trả lời tất cả n câu hỏi và những câu hỏi khác sẽ trả lời ít hơn vì hết thời gian. Nếu chúng ta có thể giả định rằng tốc độ của các ứng cử viên được phân phối bình thường, thì điểm sẽ gần với phân phối bình thường.

Nhưng nhiều bài kiểm tra sẽ chứa một số câu hỏi rất khó và một số câu hỏi rất dễ, cố ý để chúng tôi có thể phân biệt giữa các ứng viên tốt nhất (người sẽ trả lời tất cả các câu hỏi ở mức độ khó nhất định) và các ứng viên xấu nhất (những người chỉ có thể trả lời rất câu hỏi đơn giản). Điều này sẽ thay đổi sự phân phối các điểm khá mạnh mẽ.


2

2
@Tim Mặc dù sự phụ thuộc không cần thiết vào các bản phân phối bình thường và bí ẩn của việc thực hiện 100 bài kiểm tra, câu trả lời này có công trong việc cố gắng chứng minh làm thế nào một trường hợp cụ thể có thể dẫn đến phân phối rõ ràng không nhị thức. Vì vậy, nó có thể là một đóng góp có giá trị cho các câu trả lời nếu những vấn đề kỹ thuật này được giải quyết.
whuber

0

n n

n

  • 12
  • độc lập . Nhiều bài kiểm tra đặt câu hỏi được xây dựng dựa trên các câu trả lời cho (các) câu hỏi trước đó. Ai sẽ nói chắc chắn rằng điều đó sẽ không xảy ra trong bài kiểm tra trong câu hỏi này? Có những yếu tố khác có thể làm cho câu trả lời cho các câu hỏi thi không độc lập với nhau, nhưng tôi nghĩ đây là yếu tố trực quan rõ ràng nhất.

Tôi đã thấy các câu hỏi trong các lớp Thống kê mô hình các câu hỏi kiểm tra là nhị thức, nhưng chúng được đóng khung một cái gì đó dọc theo dòng:

Phân phối xác suất nào sẽ mô hình hóa số lượng câu hỏi được trả lời đúng trong bài kiểm tra trắc nghiệm trong đó mỗi câu hỏi có bốn lựa chọn và học sinh làm bài kiểm tra sẽ đoán được mọi câu trả lời một cách ngẫu nhiên?

p=14


Không có vấn đề gì với sự thật của bạn, nhưng logic là không chính xác: không đủ để chứng minh rằng một số giả định có thể không giữ được, bởi vì (về mặt logic) phân phối vẫn có thể là nhị thức trong mọi trường hợp. Bạn cũng cần chứng minh rằng những giả định này có thể thất bại theo những cách khiến phân phối điểm chắc chắn là không nhị thức.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.