Phương sai của tỷ lệ mẫu giảm theo n nhưng số lượng tăng theo n - tại sao?


9

Tôi đã có một khối trực quan với điều này. Đối với một vấn đề nhị thức, độ lệch chuẩn của một số là . Ngược lại, độ lệch chuẩn của tỷ lệ mẫu giảm khi tăngnvà lànp(1p)n . Tôi có thể thực hiện phép chia theonnhưng tôi không có cảm giác tại sao độ lệch chuẩn di chuyển theo hướng ngược lại.p(1p)nn


1
Hai điều: (a) tỷ lệ = .count1nvà (b) . Rõ ràng c = 1sd(cX)=c.sd(X) ở đây, và1c=1n . 1nn=1n
Glen_b -Reinstate Monica

1
Vâng, đây là vấn đề - tôi có thể thấy toán học và thực hiện phép chia theo n nhưng đó là khía cạnh trực quan rất kỳ lạ. Nếu được hỏi làm thế nào để có được ước tính chính xác hơn cho một tham số tôi sẽ nói hãy lấy một mẫu lớn hơn. Điều này cho tôi một ước tính tốt hơn cho tỷ lệ (OK) nhưng mức chênh lệch rộng hơn cho số lượng và tôi càng thêm số lượng, kết luận tôi có thể rút ra càng yếu.
dùng39707

Khi bạn làm việc với số đếm, số lượng dân số mà bạn đang tính độ lệch / khoảng chuẩn cho?
Glen_b -Reinstate Monica

Một ví dụ (Nghiên cứu Tim mạch Helsinki) từ một cuốn sách (Moore & Mccabe) là nơi tôi sắp ra mắt. Xác suất (đau tim) = 0,04 & n = 2000. SD cho số lần đau tim dự kiến ​​sẽ là 8,76. Khỏe. Có 84 cơn đau tim ở nhóm giả dược và 56 cơn ở nhóm được điều trị. Z = 3,19 & không có khả năng tình cờ. Nếu có 10.000 trong thử nghiệm, SD (số lượng) sẽ là ~ 20 và sự khác biệt trong 2 nhóm không còn đáng kể Nhưng làm thế nào nhiều dữ liệu có thể giúp tôi bớt phân biệt đối xử?
dùng39707

1
Là hai nhóm có kích thước bằng nhau? Số lượng các cơn đau tim có giữ nguyên khi mẫu tăng lên không?
Dimitriy V. Masterov

Câu trả lời:


7

Rất đại khái, hãy tưởng tượng rằng chúng ta đang tung một đồng tiền công bằng . Thành công được định nghĩa là người đứng đầu. Nếu chúng tôi tung đồng xu một lần , bạn sẽ tính 1 thành công hoặc 0 thành công. Cả hai đều có một xác suất dương bằng nhau xảy ra ( 1 / 2 ) . Bây giờ hãy tưởng tượng chúng ta tung đồng xu 10 lần ( n = 10 ). Bây giờ bạn vẫn có thể nhận được 01 thành công (mặc dù cả hai đều ít có khả năng hơn), nhưng bạn cũng có thể nhận được 2 đến 10(n=1)10(1/2)10n=1001210(có nhiều khả năng). Nếu phương sai đo khoảng cách một bộ số được trải ra bao xa, bạn có thể thấy với tung, mức chênh lệch rộng hơn so với 1 lần tung hoặc thử. Điều này giải thích tại sao phương sai của số lượng thành công tăng theo n .101n

Với tỷ lệ (số lần thành công chia cho số lần tung), bạn đang cố gắng xấp xỉ giá trị thực của . Khi bạn nhận được nhiều thông tin hơn với nhiều thử nghiệm hơn, sự không chắc chắn của bạn về p sẽ giảm xuống và do đó phương sai thu nhỏ lại. Với một cú quăng mà đi lên đầu, bạn không biết rất nhiều (chỉ có vậy p 0 ) . Với 10 lần ném tất cả hóa ra thành đầu, bạn khá chắc chắn rằng p đang ở gần một. ppp0)10p


Tôi đã trở lại sách giáo khoa và có vẻ như tôi vẫn không hiểu lắm. Nhận xét tôi đã đưa ra ở trên về nghiên cứu Tim Helsinki tổng hợp nơi có vẻ hơi nghịch lý đối với tôi ngay bây giờ
user39707

2

npX

Var(X)=np(1p)

Vì tỷ lệ là số lần thành công so với số lượng thử nghiệm, chúng tôi có:

Var(Xn)=Var(X)n2=np(1p)n2=p(1p)n

p(1p)n

Trong một trường hợp bạn đang nhìn vào số đếm, trong trường hợp khác bạn đang nhìn vào số lượng chia cho kích thước mẫu.

X=0,1,2,,n0p1nXpX


Var(Xn)=Var(X)n2n2

Var(X)=E(X2)[E(X)]2Var(cX)=E(c2X2)[cE(X)]2 =c2E(X2)c2E(X)2 =c2(E(X2)[E(X)]2) =c2Var(X)c=1/n

0

Được chứ! Ill làm cho nó rất dễ dàng.

Khi sử dụng tiêu chuẩn và phương sai USUALLY, bạn đang nhìn về phía sau, cố gắng xem điều gì đang xảy ra và sau đó dự đoán tương lai. khi bạn nhìn về phía sau, càng nhiều thử nghiệm thường giúp có được thông tin THÊM. Ngày càng có nhiều thử nghiệm giúp thu hẹp những gì đã xảy ra. và bây giờ bạn xoay tốt hơn xung quanh giá trị trung bình. Std và var chỉ xoay quanh giá trị trung bình để bạn tiến gần hơn và gần hơn với những gì sẽ xảy ra.

Nhị phân thì khác! chúng tôi đã biết những gì đang lên, chúng tôi biết xác suất. Vì vậy, nhìn về phía sau không hữu ích bởi vì, tốt, chúng tôi đã biết xác suất. Ngày càng có nhiều thử nghiệm không giúp chúng ta hiểu rõ hơn và tốt hơn cách mọi thứ xoay quanh giá trị trung bình, nó chỉ giúp chúng ta phân phối rộng hơn và rộng hơn. tăng các thử nghiệm thực sự chỉ cung cấp nhiều chỗ hơn cho phương sai.

Hãy tưởng tượng hai kịch bản: một bạn muốn biết mọi người cao bao nhiêu trong một căn phòng. nhiều số đo hơn = gần hơn với chiều cao trung bình thực trong phòng, bạn rất biết ơn về mỗi phép đo mới.

thứ hai bạn có một đồng tiền. bạn đã biết mức trung bình là gì. 50/50 của tôi có nghĩa là tại thời điểm đó bạn đã hoàn thành. vì vậy hãy giả vờ bạn bắt đầu lật, mỗi lần lật mới chỉ còn nhiều chỗ sai sót. bạn lật 10 lần và bạn nhận được tất cả 10 cái đầu, bạn nói với bạn của bạn, cái quái gì thế! tỷ lệ cược của nó ở đâu, thật là ngu ngốc! tốt, nếu bạn chỉ lật nó một lần, bạn sẽ chỉ có một cơ hội cho một số ngoại lệ điên rồ. nhiều lần lật hơn không thực sự cung cấp cho bạn thêm thông tin, họ chỉ dành nhiều chỗ hơn cho kết quả điên rồ.

0 toán và 0 công thức, hy vọng rằng sẽ giúp.


0

Nếu bạn đang tìm kiếm một số trực giác về kết quả này, hãy tự hỏi những điều sau đây có nhiều biến đổi hơn:

  • ... Tỷ lệ nữ trong một gia đình, hay tỷ lệ nữ trong cả nước?

  • ... Số lượng nữ trong một gia đình, hay số nữ trong cả nước?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.