Làm thế nào để tính giá trị dự kiến ​​của các sự kiện ghép?


7

Một gợi ý hữu ích sẽ được đánh giá cao vì tôi dường như không thể tìm ra cách tính giá trị mong đợi

Một lô chứa 17 mặt hàng, mỗi mặt hàng phải được kiểm tra bởi hai kỹ sư đảm bảo chất lượng. Mỗi kỹ sư chọn ngẫu nhiên và độc lập 4 mục từ lô. Xác định số lượng mục dự kiến ​​được chọn bởi:

a. cả hai kỹ sư b. không phải kỹ sư c. chính xác là một kỹ sư.


3
Theo quan điểm của kỹ sư thứ hai, đây là một thí nghiệm siêu âm.
Jarle Tufto

2
Có lẽ giải pháp đơn giản nhất là khai thác các chức năng chỉ báo của 17 mục. Sử dụng tuyến tính của kỳ vọng và tính độc lập của hai lựa chọn.
whuber

Câu trả lời:


3

Đây là một bài tập trong việc sử dụng các biến chỉ báo. Một chỉ báo có giá trị là để biểu thị một số điều kiện giữ và có giá trị khác. Dường như các vấn đề khó khăn về xác suất và kỳ vọng có thể có các giải pháp đơn giản khai thác các chỉ số và tuyến tính của kỳ vọng - ngay cả khi các biến ngẫu nhiên liên quan không độc lập. Đối với những người mới với những ý tưởng này, chi tiết đầy đủ được đưa ra dưới đây.10


Gọi các kỹ sư "X" và "Y". Lựa chọn của Mô hình X bằng biến chỉ số , trong đó17Xi, i=1,2,,17

{XTôi= =1 khi X chọn iXTôi= =0 nếu không thì.

Tương tự xác định các biến chỉ báo cho lựa chọn của Y.YTôi

Chúng ta có thể biểu thị các điều kiện trong bài toán đại số:

  • Chỉ số mà được cả hai chọn là .TôiXTôiYTôi
  • Chỉ số mà được chọn không phải là .Tôi(1-XTôi)(1-YTôi)
  • Chỉ số mà chỉ được chọn bởi X là .TôiXTôi(1-YTôi)
  • Chỉ số mà chỉ được chọn bởi Y là .Tôi(1-XTôi)YTôi

Tổng số được chọn làX

4= =X1+X2++X17= =ΣTôi= =117XTôi.

Rõ ràng tất cả biến được phân phối giống hệt nhau. Hãy được kỳ vọng chung của họ. Bởi vì34μ

4= =E[4]= =E[ΣTôi= =117XTôi]= =ΣTôi= =117E[XTôi]= =ΣTôi= =117μ= =17μ,

chúng tôi suy luận

μ= =417.

Mặc dù các biến không độc lập, được giả định độc lập với .XTôiYTôi

a. Số lượng mặt hàng dự kiến ​​được lựa chọn bởi cả hai

Tổng số mục được cả hai chọn là tổng của . Do đó, số lượng dự kiến ​​làXTôiYTôi

E[ΣTôi= =117XTôiYTôi]= =ΣTôi= =117E[XTôiYTôi]= =ΣTôi= =117E[XTôi]E[YTôi]= =ΣTôi= =117417417= =4217.

Sự độc lập của và là cần thiết để thể hiện mỗi là sản phẩm của và .XTôiYTôiE[XTôiYTôi]E[XTôi]E[YTôi]

b. Số lượng mặt hàng dự kiến ​​được chọn bởi không

Tổng số mục được chọn không phải là tổng của . Vì tất cả độc lập với tất cả , nên áp dụng chính xác cùng một phương thức được sử dụng trong (a); thay đổi duy nhất là được thay thế bằng . Giá trị phải là(1-XTôi)(1-YTôi)1-XTôi1-YTôi4/17E[1-XTôi]= =E[1-YTôi]= =13/17

E[ΣTôi= =117(1-XTôi)(1-YTôi)]= =13217.

c. Số lượng mặt hàng dự kiến ​​được chọn bởi chính xác một

Điều này có thể được giải quyết như trong (a) hoặc (b), cho vì cơ hội chỉ được chọn bởi X và như cơ hội chỉ được chọn bởi Y. Câu trả lời là tổng của các sự kiện (rời rạc) này, bằng .4/17×13/17= =52/1713/17×4/17= =52/17104/17

Một phím tắt (hoặc kiểm tra công việc) là lưu ý rằng mọi mục đều thuộc chính xác một trong hai loại , không , hoặc chính xác , và do đó, câu trả lời phải là sự khác biệt giữa tổng ( ) và tổng số câu trả lời đến (a) và (b):17

17-4217-13217= =10417.

Kiểm tra thông qua mô phỏng

Chúng ta hãy thực hiện 10.000 (giả sử) mô phỏng các lựa chọn này và theo dõi kết quả. Chúng tôi có thể xuất (a) số mục trung bình được chọn bởi cả hai, (b) số mục trung bình được chọn bởi cả hai và (c) số mục trung bình được chọn bởi chính xác một mục. Bên dưới đầu ra này, như một tài liệu tham khảo, hãy in các câu trả lời trong (a), (b) và (c). Chúng tôi sẽ không cố gắng để có hiệu quả: mục tiêu là mô hình hóa quá trình lựa chọn như được mô tả và trực tiếp đếm các sự kiện, mà không có bất kỳ thủ thuật số học nào. Đây là một số Rmã thực hiện điều đó một cách khá phức tạp trong khi vẫn chỉ mất khoảng một giây:

n.sim <- 1e4 # Number of iterations
n <- 17      # Number of items
k <- 4       # Numbers chosen by each engineer

set.seed(17) # Creates reproducible output
sim <- replicate(n.sim, {
  x <- sample.int(n, k)                       # X chooses `k` items
  y <- sample.int(n, k)                       # Y chooses 'k' items
  x.and.y <- intersect(x,y)                   # Find those chosen by both
  not.x.and.not.y <- setdiff(1:n, union(x,y)) # ... .... chosen by neither
  x.only <- setdiff(x, y)                     # ... .... chosen only by x
  y.only <- setdiff(y, x)                     # ... .... chosen only by y
  c(Both=length(x.and.y),                     # Count those chosen by both
    Neither=length(not.x.and.not.y),          # Count those chosen by neither
    One=length(x.only) + length(y.only)       # Count those chosen by one
  )
})

signif(rbind(Simulation=rowMeans(sim),                   # Average the simulations
      Theory=c(k^2/n, (n-k)^2/n, n-(k^2+(n-k)^2)/n)), 4) # Give theoretical values

Hai dòng đầu ra - trung bình trên nhiều thử nghiệm mô phỏng và các câu trả lời lý thuyết được đưa ra trước đây - đủ gần để hỗ trợ tính chính xác của các câu trả lời:

             Both Neither   One
Simulation 0.9315   9.932 6.137
Theory     0.9412   9.941 6.118
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.