Đây là một bài tập trong việc sử dụng các biến chỉ báo. Một chỉ báo có giá trị là để biểu thị một số điều kiện giữ và có giá trị khác. Dường như các vấn đề khó khăn về xác suất và kỳ vọng có thể có các giải pháp đơn giản khai thác các chỉ số và tuyến tính của kỳ vọng - ngay cả khi các biến ngẫu nhiên liên quan không độc lập. Đối với những người mới với những ý tưởng này, chi tiết đầy đủ được đưa ra dưới đây.10
Gọi các kỹ sư "X" và "Y". Lựa chọn của Mô hình X bằng biến chỉ số , trong đó17XTôi, i = 1 , 2 , Hoài , 17
{XTôi= 1XTôi= 0 khi X chọn i nếu không thì.
Tương tự xác định các biến chỉ báo cho lựa chọn của Y.YTôi
Chúng ta có thể biểu thị các điều kiện trong bài toán đại số:
- Chỉ số mà được cả hai chọn là .TôiXTôiYTôi
- Chỉ số mà được chọn không phải là .Tôi( 1 -XTôi) ( 1 -YTôi)
- Chỉ số mà chỉ được chọn bởi X là .TôiXTôi( 1 -YTôi)
- Chỉ số mà chỉ được chọn bởi Y là .Tôi( 1 -XTôi)YTôi
Tổng số được chọn làX
4 =X1+X2+ ⋯ +X17= =Σi = 117XTôi.
Rõ ràng tất cả biến được phân phối giống hệt nhau. Hãy được kỳ vọng chung của họ. Bởi vì34μ
4 = E[ 4 ] = E[Σi = 117XTôi] =Σi = 117E[XTôi] =Σi = 117μ = 17 μ ,
chúng tôi suy luận
μ =417.
Mặc dù các biến không độc lập, được giả định độc lập với .XTôiYTôi
a. Số lượng mặt hàng dự kiến được lựa chọn bởi cả hai
Tổng số mục được cả hai chọn là tổng của . Do đó, số lượng dự kiến làXTôiYTôi
E[Σi = 117XTôiYTôi] =Σi = 117E[XTôiYTôi] =Σi = 117E[XTôi] E[YTôi] =Σi = 117417417= =4217.
Sự độc lập của và là cần thiết để thể hiện mỗi là sản phẩm của và .XTôiYTôiE[XTôiYTôi]E[XTôi]E[YTôi]
b. Số lượng mặt hàng dự kiến được chọn bởi không
Tổng số mục được chọn không phải là tổng của . Vì tất cả độc lập với tất cả , nên áp dụng chính xác cùng một phương thức được sử dụng trong (a); thay đổi duy nhất là được thay thế bằng . Giá trị phải là( 1 -XTôi) ( 1 -YTôi)1 -XTôi1 -YTôi4 / 17E[ 1 -XTôi] = E[ 1 -YTôi] = 13 / 17
E[Σi = 117( 1 -XTôi) ( 1 -YTôi) ] =13217.
c. Số lượng mặt hàng dự kiến được chọn bởi chính xác một
Điều này có thể được giải quyết như trong (a) hoặc (b), cho vì cơ hội chỉ được chọn bởi X và như cơ hội chỉ được chọn bởi Y. Câu trả lời là tổng của các sự kiện (rời rạc) này, bằng .4 / 17 × 13 / 17 = 52 / 1713 / 17 × 4 / 17 = 52 / 17104 / 17
Một phím tắt (hoặc kiểm tra công việc) là lưu ý rằng mọi mục đều thuộc chính xác một trong hai loại , không , hoặc chính xác , và do đó, câu trả lời phải là sự khác biệt giữa tổng ( ) và tổng số câu trả lời đến (a) và (b):17
17 -4217-13217= =10417.
Kiểm tra thông qua mô phỏng
Chúng ta hãy thực hiện 10.000 (giả sử) mô phỏng các lựa chọn này và theo dõi kết quả. Chúng tôi có thể xuất (a) số mục trung bình được chọn bởi cả hai, (b) số mục trung bình được chọn bởi cả hai và (c) số mục trung bình được chọn bởi chính xác một mục. Bên dưới đầu ra này, như một tài liệu tham khảo, hãy in các câu trả lời trong (a), (b) và (c). Chúng tôi sẽ không cố gắng để có hiệu quả: mục tiêu là mô hình hóa quá trình lựa chọn như được mô tả và trực tiếp đếm các sự kiện, mà không có bất kỳ thủ thuật số học nào. Đây là một số R
mã thực hiện điều đó một cách khá phức tạp trong khi vẫn chỉ mất khoảng một giây:
n.sim <- 1e4 # Number of iterations
n <- 17 # Number of items
k <- 4 # Numbers chosen by each engineer
set.seed(17) # Creates reproducible output
sim <- replicate(n.sim, {
x <- sample.int(n, k) # X chooses `k` items
y <- sample.int(n, k) # Y chooses 'k' items
x.and.y <- intersect(x,y) # Find those chosen by both
not.x.and.not.y <- setdiff(1:n, union(x,y)) # ... .... chosen by neither
x.only <- setdiff(x, y) # ... .... chosen only by x
y.only <- setdiff(y, x) # ... .... chosen only by y
c(Both=length(x.and.y), # Count those chosen by both
Neither=length(not.x.and.not.y), # Count those chosen by neither
One=length(x.only) + length(y.only) # Count those chosen by one
)
})
signif(rbind(Simulation=rowMeans(sim), # Average the simulations
Theory=c(k^2/n, (n-k)^2/n, n-(k^2+(n-k)^2)/n)), 4) # Give theoretical values
Hai dòng đầu ra - trung bình trên nhiều thử nghiệm mô phỏng và các câu trả lời lý thuyết được đưa ra trước đây - đủ gần để hỗ trợ tính chính xác của các câu trả lời:
Both Neither One
Simulation 0.9315 9.932 6.137
Theory 0.9412 9.941 6.118