Xác suất mà một học sinh đạt điểm cao hơn một bài kiểm tra khác với các câu hỏi được chọn ngẫu nhiên là gì?


7

Giả sử có một bộ gồm câu hỏi và có học sinh và .S1002ab

Đặt là xác suất để câu trả lời đúng cho câu hỏi và giống với .PaiaiPbib

Tất cả và được cung cấp cho .PaiPbii=1...100

Giả sử một kỳ thi được làm bằng cách lấy câu hỏi ngẫu nhiên từ .E10S

Làm thế nào tôi có thể tìm thấy xác suất của nhận được một số điểm tốt hơn so với ?ab


Tôi đã nghĩ đến việc kiểm tra các kết hợp và so sánh các xác suất nhưng nó là một con số rất lớn và sẽ mất mãi mãi, vì vậy tôi đã hết ý tưởng.


Gọi và là số câu trả lời đúng cho và tương ứng. Khi đó theo luật tổng xác suất: . Nếu xác suất khác nhau từ câu hỏi đến câu hỏi (nghĩa là xác suất phụ thuộc vào i), thì việc đánh giá các xác suất riêng lẻ có thể yêu cầu phải trải qua tất cả các kết hợp có thể. Biện pháp có thể có ... 1. Điều này vẫn hợp lý khi sử dụng máy tính để tính toán xác suất thông qua lực lượng vũ phu. 2. Nếu bạn có thể giả định rằng (bên lề) các xác suất không phụ thuộc vào , thì đây là phân phối nhị thức đơn giản. ABabP(A>B)=x=0sP(A>B|B=x)P(B=x)i
knrumsey

@knrumsey tất cả và là các giá trị cố định và bạn có thể giả sử và ban đầu được xác định ngẫu nhiên cho . Có thể sử dụng máy tính và trên thực tế tôi đang sử dụng nó, nhưng các kết hợp tổng cộng , Điều này khá lớn để lặp lạiPaiPbiPaiPbii=1...100100!10!(10010)!
Daniel

Ý nghĩa của được tạo ngẫu nhiên là gì? Nếu và không thay đổi quá nhiều so với , thì có thể giả định Binomial sẽ cung cấp một xấp xỉ hợp lý. Đặt và tương tự cho . paipaipbiipa=1si=1spaipb
knrumsey

Thêm hai nhận xét: Nếu và được tạo từ cùng một phân phối, thì sẽ bằng 1/2. Thứ hai, nếu bạn ổn với một xấp xỉ, bạn có thể thực hiện một số mô phỏng Monte Carlo để ước tính xác suất. paipbiP(A>B)
knrumsey

Ở mỗi lần lặp, vì A chỉ tốt hơn khi A đúng và B sai. Vì vậy, nếu đối với một câu hỏi cụ thể, A đúng 90% thời gian và B đúng 80% thời gian, thì xác suất chung rằng A đúng và B sai là Bây giờ bạn có thể viết một số mã đi qua tất cả mười câu hỏi đã chọn và gán một điểm cho A hoặc B dựa trên xác suất chung này. Cuối cùng, người chiến thắng là người có nhiều điểm hơn. Làm điều này hàng ngàn lần và xem xét xác suất A chiến thắng B. Điều này có thể được gọi là Monte Carlo. P(A>B)=P(A)(1P(B))0.90.2=0.18
COOLBEANS

Câu trả lời:


6

Một chương trình năng động sẽ làm cho công việc ngắn này.

Giả sử chúng ta quản lý tất cả các câu hỏi cho học sinh và sau đó chọn ngẫu nhiên một tập hợp con I của k=10 ra khỏi tất cả n=100câu hỏi Hãy xác định một biến ngẫu nhiênXi để so sánh hai học sinh trong câu hỏi i: đặt nó thành 1 nếu học sinh A đúng và học sinh B thì không, 1 nếu học sinh B đúng và học sinh A không, và 0nếu không thì. Tổng số

XI=iIXi

là sự khác biệt về điểm số cho các câu hỏi trong I. Chúng tôi muốn tính toán Pr(XI>0). Xác suất này được thực hiện trên phân phối chung của vàIXi.

Hàm phân phối của dễ dàng được tính toánXi theo giả định mà học sinh trả lời độc lập:

Pr(Xi=1)=Pai(1Pbi)Pr(Xi=1)=Pbi(1Pai)Pr(Xi=0)=1Pr(Xi=1)Pr(Xi=0).

Là một tốc ký, chúng ta hãy gọi các xác suất này và . Viếtai, bi,di,

fi(x)=aix+bix1+di.

Đa thức này là hàm tạo xác suất choXi.

Hãy xem xét hàm hợp lý

ψn(x,t)=i=1n(1+tfi(x)).

(Trên thực tế, là một đa thức: đó là một hàm hữu tỷ khá đơn giản.) xnψn(x,t)

Khi được mở rộng dưới dạng đa thức tính bằng , hệ số của bao gồm tổng của tất cả các sản phẩm có thể có của khác biệt Đây sẽ là một hàm hợp lý với các hệ số khác không chỉ cho các lũy thừa của từ đến được chọn ngẫu nhiên một cách ngẫu nhiên, nên các hệ số của các lũy thừa này của khi được chuẩn hóa thành tổng thể, đưa ra hàm tạo xác suất cho sự khác biệt về điểm số. Các quyền hạn tương ứng với kích thước củaψnttkkfi(x).xxkxk. Ix,I.

Điểm của phân tích này là chúng ta có thể tính toán một cách dễ dàng và với hiệu quả hợp lý:ψ(x,t) chỉ cần nhân các đa thức theo tuần tự. Làm điều này đòi hỏi phải giữ lại các hệ số của trong cho(tất nhiên chúng ta có thể bỏ qua tất cả các quyền hạn cao hơn của xuất hiện trong bất kỳ sản phẩm bộ phận nào này). Theo đó, tất cả các thông tin cần thiết được mang theo có thể được biểu thị bằng ma trận , với các hàng được lập chỉ mục bởi các quyền hạn của (từ đến ) và các cột được lập chỉ mục bởin1,t,,tkψj(x,t)j=0,1,,n.tψj(x,t)2k+1×n+1xkk0 đến .k

Mỗi bước tính toán đòi hỏi công việc tỷ lệ thuận với kích thước của ma trận này, tỷ lệ là Kế toán cho số bước, đây là thuật toán không gian , . Điều đó làm cho nó khá nhanh cho nhỏ Tôi đã chạy nó trong (không được biết đến với tốc độ quá cao) cho lên tới và lên đến trong đó mất chín giây (trên một lõi). Trong cài đặt câu hỏi với và quá trình tính toán mất giây.O(k2).O(k2n)O(kn)k.Rk100n105,n=100k=10,0.03

Dưới đây là một ví dụ trong đó là các giá trị ngẫu nhiên đồng nhất giữa và và là các bình phương của chúng (luôn nhỏ hơn , do đó rất ủng hộ học sinh A). Tôi đã mô phỏng 100.000 bài kiểm tra, như được tóm tắt bằng biểu đồ này của điểm số mạng:Pai01PbiPai

![Nhân vật

Các thanh màu xanh biểu thị những kết quả mà học sinh A đạt điểm cao hơn B. Các chấm đỏ là kết quả của chương trình động. Họ đồng ý tuyệt vời với mô phỏng ( thử nghiệm, ). Tổng hợp tất cả các xác suất dương cho câu trả lời trong trường hợp này làχ2p=51%0.7526.

Lưu ý rằng phép tính này mang lại nhiều hơn so với yêu cầu: nó tạo ra toàn bộ phân phối xác suất của chênh lệch điểm cho tất cả các bài kiểm tra của hoặc ít câu hỏi được chọn ngẫu nhiên.k


Đối với những người muốn thực hiện làm việc để sử dụng hoặc cổng, đây là Rmã tạo ra mô phỏng (được lưu trữ trong vectơ Simulation) và thực hiện chương trình động (có kết quả trong mảng P). Các repeatkhối ở cuối là chỉ có để tổng hợp tất cả các kết quả hiếm bất thường để các thử nghiệm trở nên rõ ràng là đáng tin cậy. (Trong hầu hết các tình huống, điều này không thành vấn đề, nhưng nó giữ cho phần mềm không bị phàn nàn.)χ2

n <- 100
k <- 10
p <- runif(n) # Student A's chances of answering correctly
q <- p^2      # Student B's chances of answering correctly
#
# Compute the full distribution.
#
system.time({
  P <- matrix(0, 2*k+1, k+1) # Indexing from (-k,0) to (k,k)
  rownames(P) <- (-k):k
  colnames(P) <- 0:k
  P[k+1, 1] <- 1
  for (i in 1:n) {
    a <- p[i] * (1 - q[i])
    b <- q[i] * (1 - p[i])
    d <- (1 - a - b)
    P[, 1:k+1] <- P[, 1:k+1] + 
      a * rbind(0, P[-(2*k+1), 1:k]) + 
      b * rbind(P[-1,  1:k], 0) + 
      d * P[,  1:k]
  }
  P <- apply(P, 2, function(x) x / sum(x))
})
#
# Simulation to check.
#
n.sim <- 1e5
set.seed(17)
system.time(
  Simulation <- replicate(n.sim, {
    i <- sample.int(n, k)
    sum(sign((runif(k) <= p[i]) - (runif(k) <= q[i]))) # Difference in scores, A-B
  })
)
#
# Test the calculation.
#
counts <- tabulate(Simulation+k+1, nbins=2*k+1)
n <- sum(counts)
k.min <- 5
repeat {
  probs <- P[, k+1]
  i <- probs * n.sim >= k.min
  z <- sum(probs[!i]) 
  if (z * n >= 5) break
  if (k.min * (2*k+1) >= n) break
  k.min <- ceiling(k.min * 3/2)
}
probs <- c(z, probs[i])
counts <- c(sum(counts[!i]), counts[i])
chisq.test(counts, p=probs)
#
# The answer.
#
sum(P[(1:k) + k+1, k+1]) # Chance that A-B is positive

2

Ở mỗi lần lặp,

P(A>B)=P(A)(1P(B))

bởi vì A chỉ tốt hơn khi A đúng và B sai. Vì vậy, đối với một câu hỏi cụ thể, nếu A đúng 90% thời gian và B đúng 80% thời gian, thì xác suất chung rằng A đúng và B sai là

P(A,B)=0.90.2=0.18

Bây giờ bạn có thể viết một số mã đi qua tất cả mười câu hỏi đã chọn và gán một điểm cho A hoặc B dựa trên xác suất chung này. Vào cuối mỗi kỳ thi, người chiến thắng là người có nhiều điểm nhất. Làm điều này nhiều lần và xem xét khả năng A chiến thắng B.

Tôi đã viết một số mã thực hiện điều này tại đây: https://nbviewer.jupyter.org/github/kevinmcinerney/exam_probabilities/blob/master/exam_probabilities.ipynb

Biểu đồ không hiển thị trên liên kết, nhưng trông như thế này:

Mô phỏng này đã sử dụng các giá trịPai=Pbi=0.5

nhập mô tả hình ảnh ở đây

Trong ví dụ này, tôi đã chạy 1000 bài kiểm tra, mỗi bài gồm 25 câu hỏi, nhưng tất cả đều tạo thành một bộ gồm 100 câu hỏi. Trục y là xác suất mà A làm tốt hơn B trong một bài kiểm tra. Số bài kiểm tra từ (0-1000) nằm dọc theo trục x

Cả A và B đều có P ngẫu nhiên khi nhận được một câu hỏi chính xác để đồ thị hội tụ 50%. Tôi đã sử dụng 25 câu hỏi, bởi vì 10 câu hỏi không đại diện cho dân số chứa 100 câu hỏi. Sử dụng mười câu hỏi, đồ thị có nhiều khả năng hội tụ đến% gần hoặc khoảng 50%. Ba dòng là ba thử nghiệm riêng biệt.


1
Tôi hy vọng rằng các biểu đồ sẽ không hội tụ trên Khi và được phân phối đồng đều độc lập giữa và chúng sẽ hội tụ đến một giá trị rất gần với Điều đó là do thực tế là (a) cả hai học sinh đều có cơ hội xuất phát với số điểm cao hơn và (b) có khoảng cơ hội mà họ sẽ ràng buộc. 50%.PaiPbi01,41%.18%
whuber

Câu trả lời của tôi không rõ ràng, nhưng mô phỏng đã sử dụngKhông phải xác suất 0,8 và 0,9 được sử dụng trong một ví dụ trước đó. Điều đó làm rõ hay tôi vẫn còn thiếu quan điểm của bạn? Pai=Pbi=0.5.
COOLBEANS

1
Bạn bỏ lỡ điểm: Khi không có cặp nào trong số là hoặc có nhiều khả năng các học sinh sẽ có cùng tổng điểm. Khi tất cả các cặp đó bằng nhau, như trong ví dụ của bạn, do đó , điểm số của một học sinh sẽ vượt quá khả năng của một học sinh khác là 50%. Trong ví dụ của bạn cơ hội chỉ là 41%. Nhìn kỹ vào cốt truyện của bạn cho thấy nó phù hợp với 41% nhưng không phải với 50%. (Câu trả lời chính xác trong trường hợp của bạn rất dễ có được vì tất cả các xác suất đều bằng nhau: 41% xấp xỉ )(Pai,Pbi)(0,1)(1,0),215955/524288.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.