Người đăng ban đầu yêu cầu câu trả lời "giải thích như tôi 5". Giả sử giáo viên trường học của bạn mời bạn và bạn học của bạn để giúp đoán chiều rộng bàn của giáo viên. Mỗi trong số 20 học sinh trong lớp có thể chọn một thiết bị (thước kẻ, tỷ lệ, băng hoặc thước đo) và được phép đo bảng 10 lần. Tất cả các bạn được yêu cầu sử dụng các vị trí bắt đầu khác nhau trên thiết bị để tránh đọc đi đọc lại cùng một số; việc đọc bắt đầu sau đó phải được trừ khỏi lần đọc kết thúc để cuối cùng có được một phép đo chiều rộng (gần đây bạn đã học cách làm loại toán đó).
Có tổng số 200 phép đo chiều rộng được thực hiện bởi cả lớp (20 học sinh, mỗi lần đo 10). Các quan sát được bàn giao cho giáo viên, người sẽ crunch các con số. Trừ các quan sát của mỗi học sinh khỏi một giá trị tham chiếu sẽ dẫn đến 200 số khác, được gọi là độ lệch . Giáo viên tính trung bình mẫu của mỗi học sinh riêng biệt, đạt được 20 phương tiện . Trừ các quan sát của mỗi học sinh khỏi giá trị trung bình cá nhân của họ sẽ dẫn đến 200 sai lệch so với giá trị trung bình, được gọi là số dư . Nếu số dư trung bình được tính cho từng mẫu, bạn sẽ nhận thấy nó luôn bằng không. Nếu thay vào đó, chúng ta bình phương mỗi phần dư, tính trung bình cho chúng và cuối cùng hoàn tác hình vuông, chúng ta có được độ lệch chuẩn. (Nhân tiện, chúng tôi gọi phép tính cuối cùng đó là căn bậc hai (nghĩ đến việc tìm đáy hoặc cạnh của một hình vuông đã cho), vì vậy, toàn bộ hoạt động thường được gọi là căn bậc hai có nghĩa là , độ lệch chuẩn của các quan sát bằng căn bậc hai có nghĩa là bình phương của phần dư.)
Nhưng giáo viên đã biết chiều rộng bảng thực sự, dựa trên cách nó được thiết kế và xây dựng và kiểm tra trong nhà máy. Vì vậy, 200 số khác, được gọi là lỗi , có thể được tính là độ lệch của các quan sát đối với chiều rộng thực. Một lỗi trung bình có thể được tính cho mỗi mẫu học sinh. Tương tự, 20 độ lệch chuẩn của lỗi , hoặc lỗi tiêu chuẩn , có thể được tính cho các quan sát. Hơn 20 lỗi trung bình bình phươnggiá trị có thể được tính là tốt. Ba bộ 20 giá trị có liên quan là sqrt (me ^ 2 + se ^ 2) = rmse, theo thứ tự xuất hiện. Dựa trên rmse, giáo viên có thể đánh giá học sinh đã cung cấp ước tính tốt nhất cho chiều rộng của bảng. Hơn nữa, bằng cách xem xét riêng biệt về 20 lỗi trung bình và 20 giá trị lỗi tiêu chuẩn, giáo viên có thể hướng dẫn mỗi học sinh cách cải thiện bài đọc của mình.
Khi kiểm tra, giáo viên đã trừ từng lỗi từ lỗi trung bình tương ứng của họ, dẫn đến 200 số khác, chúng tôi sẽ gọi các lỗi còn lại (điều đó không thường được thực hiện). Như trên, sai số dư trung bình bằng 0, do đó độ lệch chuẩn của sai số dư hoặc sai số dư tiêu chuẩn cũng giống như lỗi tiêu chuẩn , và trên thực tế, cũng là lỗi dư có nghĩa là bình phương gốc . (Xem bên dưới để biết chi tiết.)
Bây giờ đây là một cái gì đó quan tâm đến giáo viên. Chúng tôi có thể so sánh ý nghĩa của từng học sinh với phần còn lại của lớp (tổng số 20 nghĩa là). Giống như chúng tôi đã xác định trước các giá trị điểm này:
- m: trung bình (của các quan sát),
- s: độ lệch chuẩn (của các quan sát)
- tôi: lỗi trung bình (của các quan sát)
- se: lỗi tiêu chuẩn (của các quan sát)
- rmse: lỗi trung bình gốc-bình phương (của các quan sát)
bây giờ chúng ta cũng có thể định nghĩa:
- mm: giá trị trung bình của phương tiện
- sm: độ lệch chuẩn của giá trị trung bình
- mem: lỗi trung bình của giá trị trung bình
- sem: sai số chuẩn của giá trị trung bình
- rmsem: lỗi trung bình bình phương gốc của giá trị trung bình
Chỉ khi lớp sinh viên được cho là không thiên vị, nghĩa là, nếu mem = 0, thì sem = sm = rmsem; tức là sai số chuẩn của giá trị trung bình, độ lệch chuẩn của giá trị trung bình và sai số trung bình bình phương gốc có thể giống nhau với điều kiện sai số trung bình của phương tiện là bằng không.
Nếu chúng tôi chỉ lấy một mẫu, nghĩa là, nếu chỉ có một học sinh trong lớp, độ lệch chuẩn của (các) quan sát có thể được sử dụng để ước tính độ lệch chuẩn của trung bình (sm), như sm ^ 2 ~ s ^ 2 / n, trong đó n = 10 là cỡ mẫu (số lần đọc trên mỗi học sinh). Hai người sẽ đồng ý tốt hơn khi kích thước mẫu tăng lên (n = 10,11, ...; số lần đọc nhiều hơn cho mỗi học sinh) và số lượng mẫu tăng lên (n '= 20,21, ...; nhiều học sinh hơn trong lớp). (Một cảnh báo: một "lỗi tiêu chuẩn" không đủ tiêu chuẩn thường đề cập đến lỗi tiêu chuẩn của giá trị trung bình, không phải là lỗi tiêu chuẩn của các quan sát.)
Dưới đây là một số chi tiết của các tính toán liên quan. Giá trị thực được ký hiệu là t.
Các thao tác đặt điểm:
- nghĩa là: Ý (X)
- căn bậc hai có nghĩa là: RMS (X)
- độ lệch chuẩn: SD (X) = RMS (X-MEAN (X))
THIẾT LẬP MẪU INTRA:
- các quan sát (đã cho), X = {x_i}, i = 1, 2, ..., n = 10.
- độ lệch: sự khác biệt của một tập hợp đối với một điểm cố định.
- phần dư: độ lệch của các quan sát so với giá trị trung bình của chúng, R = Xm.
- lỗi: độ lệch của các quan sát so với giá trị thực, E = Xt.
- lỗi dư: độ lệch của lỗi so với giá trị trung bình của chúng, RE = E-MEAN (E)
CÁC ĐIỂM MẪU INTRA (xem bảng 1):
- m: trung bình (của các quan sát),
- s: độ lệch chuẩn (của các quan sát)
- tôi: lỗi trung bình (của các quan sát)
- se: lỗi tiêu chuẩn của các quan sát
- rmse: lỗi trung bình gốc-bình phương (của các quan sát)
CÁC MẪU INTER-MẪU (ENSEMBLE):
- nghĩa là, M = {m_j}, j = 1, 2, ..., n '= 20.
- phần dư của giá trị trung bình: độ lệch của phương tiện so với giá trị trung bình của chúng, RM = M-mm.
- lỗi của giá trị trung bình: độ lệch của phương tiện so với "sự thật", EM = Mt.
- sai số dư của giá trị trung bình: độ lệch của sai số trung bình so với giá trị trung bình của chúng, REM = EM-MEAN (EM)
ĐIỂM INTER-SAMPLE (ENSEMBLE) (xem bảng 2):
- mm: giá trị trung bình của phương tiện
- sm: độ lệch chuẩn của giá trị trung bình
- mem: lỗi trung bình của giá trị trung bình
- sem: lỗi tiêu chuẩn (của trung bình)
- rmsem: lỗi trung bình bình phương gốc của giá trị trung bình