Có phải tất cả 20 đối tượng đều có cùng chiều cao nếu độ lệch chuẩn của mẫu được báo cáo là 0,0?


8

Nghiên cứu tôi đang xem xét các báo cáo có nghĩa là chiều cao của 20 đối tượng là 1,70 mét với độ lệch chuẩn là 0,0. Điều này có nghĩa là tất cả 20 chính xác là 1,70 mét? Hay đây là một lỗi báo cáo?

Câu trả lời:


16

Theo chủ đề sinh học SE này , độ lệch chuẩn của chiều cao nam giới trưởng thành là khoảng mét, và của nữ giới là khoảng mét.0,060,070,06

Làm tròn số này đến một vị trí thập phân sẽ cho mét. Thực tế là độ lệch chuẩn được báo cáo là mét cho thấy độ lệch chuẩn dưới mét ... nhưng độ lệch chuẩn là mét vẫn phù hợp với con số được báo cáo khi nó tròn đến , nhưng sẽ chỉ ra một sự thay đổi về độ cao trong mẫu chỉ nhỏ hơn một chút so với độ biến thiên chúng ta quan sát hàng ngày trong dân số nói chung.0,0 0,05 0,048 0,00,10,00,050,0480,0

Là con số được báo cáo tốt? Chà, sẽ hữu ích hơn nhiều nếu độ lệch chuẩn đã được báo cáo đến hai chữ số thập phân, như giá trị trung bình. Nó cũng có thể là một lỗi số hoặc làm tròn số đơn giản; ví dụ có thể đã bị cắt ngắn thành thay vì làm tròn . Nhưng có thể con số có thể đề cập đến lỗi tiêu chuẩn thay thế? Tôi thường thấy các số liệu được viết theo cách khiến nó mơ hồ cho dù độ lệch chuẩn hoặc lỗi tiêu chuẩn đang được trích dẫn - ví dụ: "giá trị trung bình mẫu là ".0,0 1,62 ( ± 0,06 )0,070,01,62(±0,06)


Làm thế nào hợp lý là nó có độ lệch chuẩn chính xác để làm tròn đến đến một chữ số thập phân? Mã R sau đây mô phỏng một triệu mẫu có kích thước hai mươi được lấy từ dân số có độ lệch chuẩn (như đã được báo cáo ở nơi khác về chiều cao nữ), tìm độ lệch chuẩn cho từng mẫu, vẽ biểu đồ kết quả và tính tỷ lệ các mẫu trong đó độ lệch chuẩn quan sát được dưới :0,06 0,050,00,060,05

set.seed(123) #so uses same random numbers each time code is run
x <- replicate(1e6, sd(rnorm(20, sd=0.06)))
hist(x)
sum(x < 0.05)/1e6

[1] 0.170691

Biểu đồ độ lệch chuẩn mẫu

Do đó, độ lệch chuẩn làm tròn đến là không hợp lý, xảy ra khoảng mười bảy phần trăm thời gian nếu độ cao thường được phân phối với độ lệch chuẩn thực .0,060,00,06

Theo các giả định này, chúng tôi cũng có thể tính toán, thay vì mô phỏng, xác suất đó xấp xỉ mười bảy phần trăm, như sau:

P(S2<0,052)= =P(19S20,062<19×0,0520,062)= =P(19S20,062<13.194)= =0,1715

trong đó chúng tôi đã sử dụng thực tế là theo phân phối chi bình phương với độ tự do. Bạn có thể tính xác suất trong R bằng cách sử dụng ; nếu bạn thay bằng phù hợp với số liệu được công bố cho độ lệch chuẩn nam, xác suất sẽ giảm xuống còn khoảng bốn phần trăm. Như @whuber chỉ ra trong các bình luận bên dưới, loại SD "tròn đến 0" nhỏ này có nhiều khả năng xảy ra nếu nhóm được lấy mẫu từ đó đồng nhất hơn so với dân số nói chung. Nếu độ lệch chuẩn dân số là khoảng(n-1)S2/σ2= =19S2/0,062n-1= =19pchisq(q = 19*0.05^2/0.06^2, df = 19)0,060,070,06 mét, sau đó xác suất đạt được độ lệch chuẩn mẫu nhỏ như vậy cũng sẽ giảm nếu kích thước mẫu lớn hơn.

curve(pchisq(q = 19*0.05^2/x^2, df = 19), from=0.005, to=0.1,
      xlab="Population SD", ylab="Probability sample SD < 0.05 if n = 20")

Xác suất SD mẫu thấp giảm nếu SD dân số tăng

curve(pchisq(q = (x-1)*0.05^2/0.06^2, df = x-1), from=2, to=50, ylim=c(0,0.6),
      xlab="Sample size", ylab="Probability sample SD < 0.05 if population SD = 0.06")

Xác suất giảm SD mẫu thấp nếu kích thước mẫu tăng


5
+1. Cũng có lý khi nghiên cứu về một nhóm người từ dân số đồng nhất, chẳng hạn như một đội thể thao, nhóm cổ vũ, v.v., trong trường hợp SD rất tốt có thể là 0,01m hoặc ít hơn.
whuber

@whuber Điểm hay! Tôi đã tự hỏi làm thế nào hợp lý để SD có thể làm tròn đến 0,00 (tức là nhỏ hơn 0,005) và đã ngạc nhiên khi các điều kiện thực sự chặt chẽ đến mức nào. Có lẽ không nên như vậy, vì nó thực sự làm giảm tỷ lệ hủy bỏ. Nhưng ví dụ, nếu đội cổ vũ có dân số SD = 0,01, thì pchisq(q = 19*0.005^2/0.01^2, df = 19)chỉ đưa ra xác suất 0,04% của mẫu SD <0,005. Ngay cả dân số SD = 0,008 cho xác suất chỉ khoảng 0,8%. Nhưng SD dân số 0,007, 0,006 và 0,005 cho xác suất lần lượt là 4%, 17% (không trùng khớp!) Và 54%
Cá bạc

3
Tôi có thể tưởng tượng một số cách để có được rất ít biến thể. Ví dụ, hãy tưởng tượng một điều kiện áp đặt chiều cao tối thiểu hoặc tối đa - ví dụ, trong quá khứ, nhiều đội quân đã áp đặt tối đa chiều cao cho phi hành đoàn xe tăng của họ, hoặc một số nơi có tối thiểu chiều cao cho cảnh sát. Nếu chúng ta đưa thuyền viên cao nhất trong mỗi trung đội xe tăng (đưa ra quy tắc chiều cao tối đa lịch sử điển hình, thường thấp hơn chiều cao trung bình) và tìm độ lệch chuẩn mẫu của chiều cao của họ, nó sẽ có xu hướng rất nhỏ, bởi vì những độ cao đó sẽ có xu hướng bị kẹt lại chống lại ranh giới.
Glen_b -Reinstate Monica

Cho rằng không có ngôn ngữ hoặc công cụ nào được chỉ định trong câu hỏi, 0,0 không nhất thiết chỉ ra làm tròn hoặc cắt ngắn đến một vị trí thập phân. 0,0 chỉ có thể là cách ngôn ngữ trong câu hỏi hiển thị 0 dưới dạng số thập phân / dấu phẩy động (mà một số ngôn ngữ làm).
Không phải

2

Nó gần như chắc chắn là một lỗi báo cáo, trừ khi mọi người được chọn vì chiều cao đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.