Sự khác biệt giữa sai số chuẩn và độ lệch chuẩn


96

Tôi đang đấu tranh để hiểu sự khác biệt giữa lỗi tiêu chuẩn và độ lệch chuẩn. Chúng khác nhau như thế nào và tại sao bạn cần đo sai số chuẩn?


7
Một nhận xét nhanh, không phải là một câu trả lời vì đã có sẵn hai câu trả lời: độ lệch chuẩn là một thuộc tính của (phân phối) biến ngẫu nhiên (s). Thay vào đó, lỗi tiêu chuẩn liên quan đến phép đo trên một mẫu cụ thể. Cả hai có thể bị lẫn lộn khi làm mờ sự khác biệt giữa vũ trụ và mẫu của bạn.
Francesco

Câu trả lời:


31

Để hoàn thành câu trả lời cho câu hỏi, Ocram đã xử lý lỗi tiêu chuẩn độc đáo nhưng không tương phản với độ lệch chuẩn và không đề cập đến sự phụ thuộc vào kích thước mẫu. Như một trường hợp đặc biệt cho người ước tính xem xét ý nghĩa mẫu. Lỗi tiêu chuẩn cho giá trị trung bình là trong đó σσ/nσlà độ lệch chuẩn dân số. Vì vậy, trong ví dụ này, chúng ta thấy rõ lỗi giảm tiêu chuẩn như thế nào khi tăng kích thước mẫu. Độ lệch chuẩn thường được sử dụng để chỉ các quan sát riêng lẻ. Vì vậy, độ lệch chuẩn mô tả sự thay đổi của các quan sát riêng lẻ trong khi sai số chuẩn cho thấy độ biến thiên của công cụ ước tính. Công cụ ước tính tốt là phù hợp có nghĩa là chúng hội tụ đến giá trị tham số thực. Khi sai số chuẩn của chúng giảm xuống 0 khi kích thước mẫu tăng thì các công cụ ước tính phù hợp, trong hầu hết các trường hợp xảy ra do lỗi tiêu chuẩn giảm về 0 như chúng ta thấy rõ ràng với trung bình mẫu.


3
Re: "... nhất quán có nghĩa là lỗi tiêu chuẩn của họ giảm xuống 0" - điều đó không đúng. Bạn có nhớ cuộc thảo luận này: stats.stackexchange.com/questions/31036/ không?
Macro

1
Tất nhiên tôi nhớ cuộc thảo luận về các trường hợp ngoại lệ khác thường và tôi đã suy nghĩ về nó khi tôi trả lời câu hỏi. Nhưng câu hỏi là về các lỗi tiêu chuẩn và theo cách hiểu đơn giản, các ước tính tham số tốt là phù hợp và có các lỗi tiêu chuẩn của chúng có xu hướng 0 như trong trường hợp của mẫu trung bình.
Michael Chernick

4
Tôi đồng ý với nhận xét của bạn - lỗi tiêu chuẩn của trung bình mẫu là 0 trung bình mẫu là nhất quán. Nhưng lỗi tiêu chuẩn của nó sẽ về 0 không phải là hậu quả của (hoặc tương đương với) thực tế là nó phù hợp, đó là những gì câu trả lời của bạn nói.
Macro

3
@Macro vâng, câu trả lời có thể được cải thiện mà tôi quyết định làm. Tôi nghĩ rằng điều quan trọng là không quá kỹ thuật với các OP vì việc đủ điều kiện mọi thứ có thể phức tạp và khó hiểu. Nhưng độ chính xác kỹ thuật không nên được hy sinh cho đơn giản. Vì vậy, tôi nghĩ rằng cách tôi giải quyết vấn đề này trong bản chỉnh sửa của mình là cách tốt nhất để làm điều này.
Michael Chernick

9
Tôi đồng ý điều quan trọng là không nhận được kỹ thuật trừ khi thực sự cần thiết. Nhận xét duy nhất của tôi là, một khi bạn đã chọn đưa ra khái niệm về tính nhất quán (một khái niệm kỹ thuật), sẽ không có cách nào để mô tả sai nó trong tên để làm cho câu trả lời dễ hiểu hơn. Tôi nghĩ rằng chỉnh sửa của bạn không giải quyết ý kiến ​​của tôi mặc dù.
Macro

51

Đây là một câu trả lời thực tế hơn (và không phải toán học):

  • SD (độ lệch chuẩn) định lượng sự phân tán - bao nhiêu giá trị khác nhau.
  • SEM (sai số chuẩn của giá trị trung bình) định lượng chính xác mức độ bạn biết trung bình thực của dân số. Nó tính đến cả giá trị của SD và kích thước mẫu.
  • Cả SD và SEM đều ở cùng một đơn vị - đơn vị của dữ liệu.
  • SEM, theo định nghĩa, luôn nhỏ hơn SD.
  • SEM càng nhỏ khi mẫu của bạn càng lớn. Điều này có ý nghĩa, bởi vì giá trị trung bình của một mẫu lớn có khả năng gần với trung bình dân số thực hơn là giá trị trung bình của một mẫu nhỏ. Với một mẫu lớn, bạn sẽ biết giá trị của giá trị trung bình với rất nhiều độ chính xác ngay cả khi dữ liệu rất phân tán.
  • SD không thay đổi có thể dự đoán khi bạn có được nhiều dữ liệu hơn. SD bạn tính toán từ một mẫu là ước tính tốt nhất có thể về SD của tổng thể. Khi bạn thu thập nhiều dữ liệu hơn, bạn sẽ đánh giá SD của dân số với độ chính xác cao hơn. Nhưng bạn không thể dự đoán liệu SD từ một mẫu lớn hơn sẽ lớn hơn hay nhỏ hơn SD từ một mẫu nhỏ. (Đây là một sự đơn giản hóa, không hoàn toàn đúng. Xem bình luận bên dưới.)

Lưu ý rằng các lỗi tiêu chuẩn có thể được tính cho hầu hết mọi tham số bạn tính toán từ dữ liệu, không chỉ giá trị trung bình. Cụm từ "lỗi tiêu chuẩn" là một chút mơ hồ. Các điểm trên chỉ đề cập đến lỗi tiêu chuẩn của giá trị trung bình.

(Từ Hướng dẫn thống kê GraphPad mà tôi đã viết.)


11
+1 Cho lời khuyên rõ ràng, hữu ích. Nhưng một số làm rõ theo thứ tự, trong đó quan trọng nhất là viên đạn cuối cùng: Tôi muốn thách thức bạn chơi một trò chơi dự đoán SD. Chúng tôi quan sát SD của các mẫu iid của, phân phối chuẩn. Tôi sẽ dự đoán liệu SD sẽ cao hơn hay thấp hơn sau các mẫu , nói. Bạn trả cho tôi một đô la nếu tôi đúng, nếu không tôi trả cho bạn một đô la. (Với cách chơi chính xác - mà tôi mời bạn tìm hiểu! - kỳ vọng của trò chơi này là tích cực đối với tôi, tăng cao khoảng đô la khi )100 * n 0,18 n = 2n100n.18n=2
whuber

4
@whuber: Tất nhiên là bạn đúng. Đó là phương sai (bình phương SD) sẽ không thay đổi có thể dự đoán khi bạn thêm nhiều dữ liệu. SD sẽ lớn hơn một chút khi kích thước mẫu tăng lên, đặc biệt là khi bạn bắt đầu với các mẫu nhỏ. Thay đổi này rất nhỏ so với thay đổi trong SEM khi thay đổi kích thước mẫu.
Harvey Motulsky

@HarveyMotulsky: Tại sao sd tăng?
Andrew

Với các mẫu lớn, phương sai mẫu sẽ khá gần với phương sai dân số, do đó SD mẫu sẽ gần với SD dân số. Với các mẫu nhỏ hơn, phương sai mẫu sẽ trung bình bằng phương sai dân số, nhưng sự khác biệt sẽ lớn hơn. Nếu đối xứng là phương sai, chúng sẽ không đối xứng như SD. Ví dụ: Phương sai dân số là 100. Hai phương sai mẫu là 80 hoặc 120 (đối xứng). SD mẫu phải là 10, nhưng sẽ là 8,94 hoặc 10,95. SD mẫu trung bình từ phân bố đối xứng xung quanh phương sai dân số và SD trung bình sẽ thấp, với N
Harvey Motulsky

43

Hãy để là thông số quan tâm của bạn mà bạn muốn suy luận. Để thực hiện điều này, bạn đã có sẵn cho bạn một mẫu quan sát cùng với một số kỹ thuật để có được ước tính , . Trong ký hiệu này, tôi đã nói rõ rằng phụ thuộc vào . Thật vậy, nếu bạn đã có một mẫu khác, , bạn sẽ kết thúc với một ước tính khác, . Điều này làm cho nhận ra một biến ngẫu nhiên mà tôi biểu thịx = { x 1 , ... , x n } θ θ ( x ) θ ( x ) x ~ x θ ( ~ x ) θ ( x ) θ θ ( x ) θθx={x1,,xn}θθ^(x)θ^(x)xx~θ^(x~)θ^(x)θ^. Biến ngẫu nhiên này được gọi là một công cụ ước tính. Các sai số chuẩn của (= ước tính) là độ lệch chuẩn của (= biến ngẫu nhiên). Nó chứa thông tin về mức độ tự tin của bạn về ước tính của bạn. Nếu nó lớn, điều đó có nghĩa là bạn có thể có được một ước tính hoàn toàn khác nếu bạn đã vẽ một mẫu khác. Các lỗi tiêu chuẩn được sử dụng để xây dựng khoảng tin cậy.θ^(x)θ^


1
Là lỗi tiêu chuẩn của ước tính bằng độ lệch chuẩn của biến ước tính?
Yurii

6

(lưu ý rằng tôi đang tập trung vào lỗi tiêu chuẩn của giá trị trung bình, tôi tin rằng người hỏi cũng vậy, nhưng bạn có thể tạo ra một lỗi tiêu chuẩn cho bất kỳ thống kê mẫu nào)

Lỗi tiêu chuẩn có liên quan đến độ lệch chuẩn nhưng chúng không giống nhau và việc tăng kích thước mẫu không làm cho chúng gần nhau hơn. Thay vào đó, nó làm cho họ xa nhau hơn. Độ lệch chuẩn của mẫu trở nên gần hơn với độ lệch chuẩn dân số khi kích thước mẫu tăng nhưng không phải là sai số chuẩn.

Đôi khi thuật ngữ xung quanh này là một chút dày để vượt qua.

Khi bạn thu thập một mẫu và tính độ lệch chuẩn của mẫu đó, khi mẫu tăng kích thước, ước tính độ lệch chuẩn sẽ ngày càng chính xác hơn. Có vẻ như từ câu hỏi của bạn đó là những gì bạn đã suy nghĩ về. Nhưng cũng xem xét rằng trung bình của mẫu có xu hướng gần với trung bình dân số hơn. Điều đó rất quan trọng để hiểu lỗi tiêu chuẩn.

Lỗi tiêu chuẩn là về những gì sẽ xảy ra nếu bạn có nhiều mẫu có kích thước nhất định. Nếu bạn lấy một mẫu 10, bạn có thể có được một số ước tính về giá trị trung bình. Sau đó, bạn lấy một mẫu khác gồm 10 và ước tính trung bình mới, v.v. Độ lệch chuẩn của phương tiện của các mẫu đó là sai số chuẩn. Cho rằng bạn đã đặt ra câu hỏi của mình, bây giờ bạn có thể thấy rằng nếu N cao thì sai số chuẩn sẽ nhỏ hơn vì phương tiện mẫu sẽ ít có khả năng sai lệch nhiều so với giá trị thực.

Đối với một số người nghe có vẻ kỳ diệu khi bạn đã tính toán điều này từ một mẫu. Vì vậy, những gì bạn có thể làm là bootstrap một lỗi tiêu chuẩn thông qua mô phỏng để thể hiện mối quan hệ. Trong R trông giống như:

# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100

# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)

Bạn sẽ thấy rằng hai lệnh cuối cùng tạo ra cùng một số (xấp xỉ). Bạn có thể thay đổi các giá trị n, m và s và chúng sẽ luôn xuất hiện khá gần nhau.


Tôi thấy điều này thực sự hữu ích, cảm ơn vì đã đăng. Liệu có công bằng không khi mô tả lỗi tiêu chuẩn là "độ lệch chuẩn của phân phối lấy mẫu"? Phân phối lấy mẫu là y trong khối mã của bạn ở trên? Đây là điều làm tôi bối rối, kết hợp các tham số mẫu sd và có nghĩa là với các tham số phân phối lấy mẫu.
Doug Fir

1
Nếu bạn thay đổi từ ngữ của bạn để chỉ định phương tiện mẫu cho trường hợp này, có.
John
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.