Có rất nhiều giáo dân thực hành giảng dạy về độ lệch chuẩn và phương sai.
TL; DR; Nó là một cái gì đó như trung bình của khoảng cách từ trung bình. (có một chút khó hiểu và sai lệch trong phiên bản ngắn gọn như vậy. Vì vậy, hãy đọc toàn bộ bài viết)
Tôi giả sử cư sĩ biết về trung bình. Tôi nói về Tầm quan trọng của việc biết SD và ước tính lỗi (xem PS bên dưới). Sau đó, tôi hứa rằng sẽ không có kiến thức thống kê cao hoặc toán học nào được sử dụng - chỉ là một lý luận khô khan và logic thuần túy.
Vấn đề. Hãy nói rằng chúng ta có một nhiệt kế (tôi chọn một thiết bị đo tùy thuộc vào những gì gần với thính giác hơn).
Chúng tôi đã thực hiện N phép đo cùng nhiệt độ và nhiệt kế cho chúng tôi thấy một số thứ như 36,5, 35,9, 37,0, 36,6, ... (xem hình). Chúng tôi biết rằng nhiệt độ thực là như nhau, nhưng nhiệt kế nằm cho chúng tôi mỗi lần đo.
Làm thế nào chúng ta có thể ước tính bao nhiêu cặn bã này nói dối với chúng ta?
Chúng ta có thể tính trung bình (xem dòng màu đỏ trên hình bên dưới). Chúng ta có thể tin được không? Ngay cả sau khi tính trung bình, nó có đủ độ chính xác cho nhu cầu của chúng ta không?
Cách tiếp cận dễ nhất . Chúng ta có thể lấy điểm xa nhất, tính khoảng cách giữa nó và điểm trung bình (đường màu đỏ) và nói rằng đây là cách nhiệt kế nằm với chúng ta, bởi vì đó là lỗi tối đa chúng ta thấy. Người ta có thể đoán, nó không phải là ước tính tốt nhất. Nếu chúng ta nhìn vào bức tranh, hầu hết các điểm đều ở mức trung bình, làm thế nào chúng ta có thể quyết định chỉ bằng một điểm? Trên thực tế người ta có thể thực hành đánh số lý do tại sao ước tính như vậy là thô và thường xấu.
Phương sai . Sau đó ... hãy lấy tất cả khoảng cách và tính khoảng cách trung bình !
BTW, làm thế nào để tính khoảng cách? Khi bạn nghe "khoảng cách" trong tiếng Anh (tiếng Tây Ban Nha? Tiếng Đan Mạch?), Nó sẽ dịch thành "phép trừ" trong toán học. Do đó, chúng tôi bắt đầu công thức của mình với trong đó là trung bình và là một trong các phép đo.ˉ x x i(xi−x¯)x¯xi
Sau đó, người ta có thể tưởng tượng rằng công thức của khoảng cách trung bình sẽ là tổng hợp mọi thứ và chia cho N:
∑(xi−x¯)N
Nhưng có một vấn đề. Chúng ta có thể dễ dàng nhìn thấy, ví dụ. 36,4 và 36,8 ở cùng khoảng cách từ 36,6. nhưng nếu chúng ta đặt các giá trị trong công thức trên, chúng ta sẽ nhận được -0.2 và +0.2 và tổng của chúng bằng 0, đó không phải là điều chúng ta muốn.
Làm thế nào để thoát khỏi dấu hiệu? (Tại thời điểm này, cư sĩ thường nói "Lấy giá trị tuyệt đối" và nhận được gợi ý rằng "lấy một giá trị tuyệt đối là một chút giả tạo, cách khác là gì?"). Chúng ta có thể bình phương các giá trị! Sau đó, công thức trở thành:
∑(xi−x¯)2N
.
Công thức này được gọi là "Phương sai" trong thống kê. Và nó phù hợp hơn nhiều để ước tính sự lan truyền của các giá trị nhiệt kế (hoặc bất cứ thứ gì) của chúng tôi, hơn là chỉ lấy khoảng cách tối đa.
Độ lệch chuẩn . Nhưng vẫn còn một vấn đề nữa. Nhìn vào công thức phương sai. Hình vuông làm cho các đơn vị đo lường của chúng tôi ... bình phương. Nếu nhiệt kế đo nhiệt độ theo ° C (hoặc ° F) thì ước tính sai số của chúng tôi được đo bằng (hoặc ). Làm thế nào để trung hòa các hình vuông? - Sử dụng căn bậc hai!°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
Vì vậy, ở đây chúng ta đến với công thức Độ lệch chuẩn thường được ký hiệu là . Và đó là cách tốt hơn để ước tính độ chính xác của thiết bị của chúng tôi.σ
Tại thời điểm này, một giáo dân hiểu khá rõ ràng, làm thế nào chúng ta đến đây và làm thế nào độ lệch / phương sai tiêu chuẩn hoạt động. Từ thời điểm này, tôi thường đi đến quy tắc 68195959999, cũng mô tả về lấy mẫu và dân số, lỗi tiêu chuẩn so với các điều khoản độ lệch chuẩn Etc.
PS Tầm quan trọng của việc biết ví dụ về SD talk:
Hãy nói rằng bạn có một số thiết bị đo lường, có giá 1 000 000 $ . Và nó cho bạn câu trả lời: 42. Bạn có nghĩ rằng một người đã trả 1 000 000 $ cho 42 không? Phooey! Một người đã trả 1000 000 cho độ chính xác của câu trả lời đó. Bởi vì Giá trị - chi phí không có gì mà không biết Lỗi của nó. Bạn trả tiền cho lỗi, không phải giá trị. Đây là một ví dụ cuộc sống tốt.
Trong cuộc sống chung, hầu hết các lần chúng ta sử dụng thước đo để đo khoảng cách. Thước đo cung cấp cho bạn độ chính xác khoảng một milimét (nếu bạn không ở Mỹ). Điều gì nếu bạn phải vượt ra ngoài milimet và đo một cái gì đó với độ chính xác 0,1mm? - Bạn có thể sẽ sử dụng một caliper. Bây giờ, thật dễ dàng để kiểm tra, rằng một cây thước rẻ nhất (nhưng vẫn có độ chính xác đến từng milimet) có giá xu, trong khi caliper tốt có giá bằng mười đô la. 2 độ lớn của một mức giá cho 1 độ lớn của độ chính xác. Và đó là điều rất bình thường về số tiền bạn phải trả cho một lỗi.