Sự khác biệt giữa phương sai và độ lệch chuẩn là gì?


127

Tôi đã tự hỏi sự khác biệt giữa phương sai và độ lệch chuẩn là gì.

Nếu bạn tính toán hai giá trị, rõ ràng bạn nhận được độ lệch chuẩn ngoài phương sai, nhưng điều đó có nghĩa gì về mặt phân phối mà bạn đang quan sát?

Hơn nữa, tại sao bạn thực sự cần một độ lệch chuẩn?



12
Bạn có thể có câu trả lời ngay bây giờ. Tuy nhiên, liên kết này có lời giải thích đơn giản nhất và tốt nhất. mathsisfun.com/data/stiteria-deviation.html

2
Độ lệch chuẩn rất hữu ích vì giá trị nằm trong cùng thang đo với dữ liệu được tính toán. Nếu đo mét, độ lệch chuẩn sẽ là mét. Phương sai, ngược lại, sẽ là bình phương mét.
Vladislavs Dovgalecs

Biến thiên tiêu chuẩn có thể không thiên vị nhưng Độ lệch chuẩn không thể vì hàm căn bậc hai không tuyến tính.
Daksh Gargas

Câu trả lời:


85

Độ lệch chuẩn là căn bậc hai của phương sai.

Độ lệch chuẩn được biểu thị theo cùng đơn vị với giá trị trung bình, trong khi phương sai được biểu thị bằng đơn vị bình phương, nhưng để xem phân phối, bạn có thể sử dụng miễn là bạn hiểu rõ về những gì bạn đang sử dụng. Ví dụ: phân phối Bình thường với mean = 10 và sd = 3 hoàn toàn giống với phân phối Bình thường với mean = 10 và variance = 9.


58
Vâng, đó là cách toán học để giải thích hai tham số này, NHƯNG giải thích logic là gì? Tại sao tôi thực sự cần hai tham số để hiển thị cùng một thứ (độ lệch xung quanh giá trị trung bình) ...
Le Max

5
Bạn không thực sự cần cả hai. Nếu bạn báo cáo một, bạn không cần phải báo cáo khác
Peter Flom

8
Chúng ta cần cả hai: độ lệch chuẩn là tốt cho việc giải thích, báo cáo. Đối với việc phát triển lý thuyết phương sai là tốt hơn.
kjetil b halvorsen

4
Lợi ích của việc báo cáo độ lệch chuẩn là nó vẫn nằm trong thang đo dữ liệu. Giả sử, một mẫu chiều cao trưởng thành tính bằng mét, thì độ lệch chuẩn cũng sẽ tính bằng mét.
Vladislavs Dovgalecs

5
Var(Xi)=Var(Xi)

49

Bạn không cần cả hai. Họ từng có mục đích khác nhau. SD thường hữu ích hơn để mô tả sự biến đổi của dữ liệu trong khi phương sai thường hữu ích hơn về mặt toán học. Ví dụ: tổng các phân phối không tương quan (các biến ngẫu nhiên) cũng có một phương sai là tổng các phương sai của các phân phối đó. Điều này sẽ không đúng với SD. Mặt khác, SD có sự tiện lợi được thể hiện bằng các đơn vị của biến ban đầu.


24

Nếu John đề cập đến các biến ngẫu nhiên độc lập khi anh ta nói "phân phối không liên quan", thì phản ứng của anh ta là chính xác. Tuy nhiên, để trả lời câu hỏi của bạn, có một số điểm có thể được thêm vào:

  1. Giá trị trung bình và phương sai là hai tham số xác định phân phối chuẩn.

  2. k

  3. z0t

  4. 68%195.4%299%3

  5. Tỷ lệ sai số được biểu thị bằng bội số của độ lệch chuẩn của ước tính.

  6. Phương sai và độ lệch là các số đo của độ không đảm bảo trong một đại lượng ngẫu nhiên. Lỗi bình phương trung bình cho một ước tính bằng phương sai + độ lệch bình phương.


4
Có lẽ bạn không nên nói "tham số tự nhiên", có nghĩa là chia cho phương sai và 1 chia cho phương sai: en.wikipedia.org/wiki/Natural_parameter
Neil G

σ

Trong điểm 3, không nên sử dụng "độ lệch chuẩn được sử dụng để chuẩn hóa số liệu thống kê" thay vì chuẩn hóa?
Harry

15

Phương sai của tập dữ liệu đo lường sự phân tán toán học của dữ liệu so với giá trị trung bình. Tuy nhiên, mặc dù giá trị này đúng về mặt lý thuyết, rất khó áp dụng theo nghĩa thực tế vì các giá trị được sử dụng để tính toán nó đã được bình phương. Độ lệch chuẩn, vì căn bậc hai của phương sai cho một giá trị ở cùng đơn vị với các giá trị ban đầu, giúp làm việc dễ dàng hơn nhiều và dễ diễn giải hơn khi kết hợp với khái niệm đường cong thông thường.


Điều này làm một công việc tuyệt vời giải thích tại sao trong điều kiện đơn giản.
gwg

3
Một điểm tốt khác để thực hiện là mỗi số liệu sd và var đo lường mức độ lây lan của biến về giá trị trung bình. Lấy căn bậc hai của phương sai để có độ lệch chuẩn có thể được xem như là một hệ số tỷ lệ được áp dụng để đưa số liệu trở lại thành các đơn vị của biến.
Matt L.

6

Về mặt phân phối, chúng tương đương (nhưng rõ ràng là không thể thay thế cho nhau), nhưng hãy cẩn thận rằng về mặt ước tính chúng không phải là: căn bậc hai của ước tính phương sai KHÔNG phải là ước lượng (không thiên vị) của độ lệch chuẩn. Chỉ với số lượng mẫu vừa phải (và tùy thuộc vào người ước tính), hai mẫu tiếp cận nhau. Đối với kích thước mẫu nhỏ, bạn cần biết dạng tham số của phân phối để chuyển đổi giữa hai loại, có thể trở nên hơi tròn.


4

Trong khi tính toán phương sai, chúng tôi bình phương độ lệch. Nó có nghĩa là nếu dữ liệu đã cho (quan sát) tính bằng mét, nó sẽ trở thành mét vuông. Hy vọng nó không đại diện chính xác về những sai lệch. Vì vậy, chúng tôi căn bậc hai một lần nữa (SD) không gì khác ngoài SD.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.