Trực giác của tôi là độ lệch chuẩn là: thước đo sự lan truyền của dữ liệu.
Bạn có một điểm tốt là nó rộng hay chặt phụ thuộc vào giả định cơ bản của chúng ta là gì cho việc phân phối dữ liệu.
Hãy cẩn thận: Một biện pháp lan truyền là hữu ích nhất khi phân phối dữ liệu của bạn đối xứng quanh giá trị trung bình và có phương sai tương đối gần với phân phối Bình thường. (Điều này có nghĩa là nó xấp xỉ Bình thường.)
Trong trường hợp dữ liệu xấp xỉ Bình thường, độ lệch chuẩn có cách hiểu chính tắc:
- Vùng: Giá trị trung bình mẫu +/- 1 độ lệch chuẩn, chứa khoảng 68% dữ liệu
- Vùng: Giá trị trung bình mẫu +/- 2 độ lệch chuẩn, chứa khoảng 95% dữ liệu
- Vùng: Giá trị trung bình mẫu +/- 3 độ lệch chuẩn, chứa khoảng 99% dữ liệu
(xem hình ảnh đầu tiên trong Wiki )
Điều này có nghĩa là nếu chúng ta biết trung bình dân số là 5 và độ lệch chuẩn là 2,83 và chúng tôi giả sử phân phối là xấp xỉ Bình thường, tôi sẽ nói với bạn rằng tôi chắc chắn một cách hợp lý rằng nếu chúng ta thực hiện (rất nhiều) nhiều quan sát, chỉ 5% sẽ nhỏ hơn 0,4 = 5 - 2 * 2.3 hoặc lớn hơn 9,6 = 5 + 2 * 2.3.
Lưu ý ảnh hưởng của độ lệch chuẩn đến khoảng tin cậy của chúng tôi là gì? (càng lan rộng, càng không chắc chắn)
Hơn nữa, trong trường hợp chung khi dữ liệu thậm chí không gần như bình thường, nhưng vẫn đối xứng, bạn biết rằng tồn tại một số mà:α
- Vùng: Độ lệch chuẩn trung bình +/- , chứa khoảng 95% dữ liệuα
Bạn có thể tìm hiểu từ một mẫu phụ hoặc giả sử α = 2 và điều này thường mang đến cho bạn một quy tắc tốt để tính toán trong đầu những quan sát trong tương lai, hoặc những quan sát mới nào có thể được coi là ngoại lệ. (hãy luôn cảnh giác!)αα=2
Tôi không thấy bạn phải giải thích nó như thế nào. Liệu 2,83 có nghĩa là các giá trị được trải rất rộng hay tất cả chúng được tập hợp chặt chẽ xung quanh giá trị trung bình ...
Tôi đoán mọi câu hỏi hỏi "rộng hay chặt", cũng nên chứa: "liên quan đến cái gì?". Một gợi ý có thể là sử dụng phân phối nổi tiếng làm tài liệu tham khảo. Tùy thuộc vào ngữ cảnh, có thể hữu ích khi nghĩ về: "Nó rộng hơn nhiều hay chặt hơn Bình thường / Poisson?".
EDIT: Dựa trên một gợi ý hữu ích trong các bình luận, thêm một khía cạnh về độ lệch chuẩn là thước đo khoảng cách.
Tuy nhiên, một trực giác của tính hữu ích của độ lệch chuẩn là nó là một thước đo khoảng cách giữa các dữ liệu mẫu x 1 , ... , x N và nó có nghĩa là ˉ x :sNx1,…,xNx¯
sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√
Để so sánh, lỗi bình phương trung bình (MSE), một trong những biện pháp lỗi phổ biến nhất trong thống kê, được định nghĩa là:
MSE=1n∑ni=1(Yi^−Yi)2
Các câu hỏi có thể được nêu ra tại sao các chức năng khoảng cách trên? Tại sao khoảng cách bình phương, và không phải khoảng cách tuyệt đối chẳng hạn? Và tại sao chúng ta lấy căn bậc hai?
Có khoảng cách bậc hai, hoặc lỗi, các hàm có lợi thế là chúng ta có thể phân biệt và dễ dàng giảm thiểu chúng. Theo như căn bậc hai có liên quan, nó thêm vào khả năng diễn giải khi nó chuyển đổi lỗi trở lại quy mô của dữ liệu quan sát của chúng tôi.