Độ lệch chuẩn của độ lệch chuẩn


54

Công cụ ước tính độ lệch chuẩn của độ lệch chuẩn là gì nếu tính chuẩn của dữ liệu có thể được giả sử?


Tôi cho rằng bạn đang tìm kiếm sự phân phối của phương sai mẫu . Liên kết này đến một phần trên trang Wikipedia về phương sai vào 16:55, ngày 21 tháng 8 năm 2016. Bởi vì đây là liên kết đến Wikipedia, bài viết có thể thay đổi trong tương lai. Do đó, phần có thể không phản ánh nội dung câu trả lời này được đề cập sau những thay đổi đó. Do đó, một liên kết đến một phiên bản lịch sử của trang Wikipedia được đưa ra ở đây. Bài báo hiện tại về phương sai được tìm thấy [tại đây] ( en.wikipedia.org/wik

Câu trả lời:


58

Cho . Như thể hiện trong chủ đề này , độ lệch chuẩn của độ lệch chuẩn mẫu,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

Γ()nX¯=1ni=1nXisσσsSD(s)

E(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 Thật tuyệt khi thấy không chỉ có một câu trả lời tốt hơn xuất hiện sau gần hai năm, mà là một câu trả lời cung cấp nhiều chi tiết hữu ích hơn các tài liệu tham khảo ở nơi khác trong chủ đề này.
whuber

2
Bạn đã quên bình phương khoảng cách trong công thức đầu tiên?
danijar

2
nse(11n)n11

1
Có lẽ đáng để chỉ ra rằng s (được tính trong câu trả lời của @ Macro đôi khi được gọi là lỗi tiêu chuẩn của độ lệch chuẩn mẫu.
Harvey Motulsky

s/2(n1)

5

X1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n


Không phải đó là một chức năng của công cụ ước tính vẫn là một công cụ ước tính? Tôi vẫn không biết \ sigma, chỉ X_i.

σ^/n

2σ^22n

1
σ^2n

-3

@Macro cung cấp một giải thích toán học tuyệt vời với phương trình để tính toán. Dưới đây là một khám phá tổng quát hơn cho những người ít toán học.

Tôi nghĩ thuật ngữ "SD của SD" gây nhầm lẫn cho nhiều người. Dễ dàng hơn để suy nghĩ về khoảng tin cậy của SD. Làm thế nào chính xác là độ lệch chuẩn bạn tính toán từ một mẫu? Chỉ tình cờ bạn có thể đã có được dữ liệu được kết hợp chặt chẽ với nhau, làm cho SD mẫu thấp hơn nhiều so với SD dân số. Hoặc bạn có thể có các giá trị ngẫu nhiên thu được phân tán hơn nhiều so với tổng dân số, làm cho SD mẫu cao hơn SD dân số.

Giải thích CI của SD rất đơn giản. Bắt đầu với giả định thông thường rằng dữ liệu của bạn được lấy mẫu ngẫu nhiên và độc lập từ phân phối Gaussian. Bây giờ lặp lại lấy mẫu này nhiều lần. Bạn mong đợi 95% các khoảng tin cậy đó sẽ bao gồm SD dân số thực sự.

Khoảng tin cậy 95% của SD rộng bao nhiêu? Nó phụ thuộc vào kích thước mẫu (n) của khóa học.

n: 95% CI của SD

2: 0,45 * SD đến 31,9 * SD

3: 0,52 * SD đến 6,29 * SD

5: 0,60 * SD đến 2,87 * SD

10: 0,69 * SD đến 1,83 * SD

25: 0,78 * SD đến 1,39 * SD

50: 0,84 * SD đến 1,25 * SD

100: 0,88 * SD đến 1,16 * SD

500: 0,94 * SD đến 1,07 * SD

Máy tính web miễn phí


Tôi có thể làm Monte Carlo, tôi chỉ muốn làm theo cách 'nghiêm túc' hơn; Tuy nhiên, bạn vẫn đúng rằng phân phối không bình thường, vì vậy sd này sẽ vô dụng để thử nghiệm.

4
Đối với giá trị của nó, tôi không thoải mái với tuyên bố "khoảng tin cậy 95% ... có khả năng chứa SD thực sự" (hoặc, được nêu rõ hơn trong trang được liên kết: "bạn có thể chắc chắn 95% rằng CI được tính toán từ SD mẫu chứa SD dân số thực "). Tôi nghĩ rằng những tuyên bố này tán tỉnh w / củng cố một quan niệm sai lầm phổ biến, xem ở đây , ví dụ, cho một cuộc thảo luận liên quan về CV.
gung - Phục hồi Monica

5
"Tôi nghĩ cả khái niệm và thuật ngữ của" SD của SD "là quá trơn để giải quyết" nghĩa là gì? Độ lệch chuẩn mẫu là một biến ngẫu nhiên có độ lệch chuẩn.
Macro

@Macro. Cảm ơn ý kiến ​​của bạn. Tôi viết lại đáng kể.
Harvey Motulsky

1
@gung. Tôi viết lại để giải thích chính xác khoảng tin cậy.
Harvey Motulsky
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.