Ví dụ của bạn cho thấy rằng không chỉ biến độc lập, chúng còn có cùng phân phối Bình thường. Đặt tham số của nó là (giá trị trung bình) và (phương sai) và giả sử tập hợp con bao gồm của các biến này. Chúng tôi cũng có thể lập chỉ mục các biến để là tập hợp con này.nX1,X2,…,Xnμσ2kX1,…,Xk
Câu hỏi yêu cầu tính toán cơ hội tổng của các biến đầu tiên bằng hoặc vượt quá tổng của phần còn lại:k
pn,k(μ,σ)=Pr(X1+⋯+Xk≥Xk+1+⋯+Xn)=Pr(Y≤0)
Ở đâu
Y=−(X1+⋯+Xk)+(Xk+1+⋯+Xn).
Y là tổ hợp tuyến tính của các biến Bình thường độc lập và do đó có phân phối Bình thường - nhưng đó là biến nào? Quy luật của sự kỳ vọng và phương sai ngay lập tức cho chúng ta biết
E[Y]=−kμ+(n−k)μ=(n−2k)μ
và
Var(Y)=kσ2+(n−k)σ2=nσ2.
Do đó có phân phối chuẩn thông thường với chức năng phân phối từ đó câu trả lời làZ=Y−(n−2k)μσn−−√
Φ,
pn,k(μ,σ)=Pr(Y≤0)=Pr(Z≤−(n−2k)μσn−−√)=Φ(−(n−2k)μσn−−√).
Trong câu hỏi, và từ đâun=5,k=2,μ=10,σ=3,
p5,2(10,3)=Φ(−(5−2(2))10310−−√)≈0.0680186.
Sự khái quát
Ít cần thay đổi trong phân tích này ngay cả khi có các phân phối bình thường khác nhau hoặc thậm chí tương quan với nhau: bạn chỉ cần giả sử rằng chúng có phân phối Bình thường để đảm bảo kết hợp tuyến tính của chúng vẫn có phân phối Bình thường. Các tính toán được thực hiện theo cùng một cách và dẫn đến một công thức tương tự.Xin
Kiểm tra
Một bình luận đề nghị giải quyết điều này với mô phỏng. Mặc dù đó không phải là một giải pháp, nhưng đó là cách tốt để kiểm tra giải pháp một cách nhanh chóng. Do đó, R
chúng ta có thể thiết lập các đầu vào của mô phỏng theo một cách tùy ý như
n <- 5
k <- 2
mu <- 10
sigma <- 3
n.sim <- 1e6 # Simulation size
set.seed(17) # For reproducible results
và mô phỏng dữ liệu đó và so sánh các khoản tiền với hai dòng này:
x <- matrix(rnorm(n*n.sim, mu, sigma), ncol=n)
p.hat <- mean(rowSums(x[, 1:k]) >= rowSums(x[, -(1:k)]))
Các hậu xử lý bao gồm việc tìm kiếm phần của bộ dữ liệu mô phỏng trong đó một số tiền vượt quá khác và so sánh rằng với các giải pháp lý thuyết:
se <- sqrt(p.hat * (1-p.hat) / n.sim)
p <- pnorm(-(n-2*k)*mu / (sigma * sqrt(n)))
signif(c(Simulation=p.hat, Theory=p, `Z-score`=(p.hat-p)/se), 3)
Sản lượng trong trường hợp này là
Simulation Theory Z-score
0.0677 0.0680 -1.1900
Thỏa thuận này gần và điểm z tuyệt đối nhỏ cho phép chúng ta quy sự khác biệt cho các dao động ngẫu nhiên thay vì bất kỳ lỗi nào trong đạo hàm lý thuyết.