Cảm ơn bạn cho câu hỏi đơn giản nhưng sâu sắc này về các khái niệm thống kê cơ bản về trung bình, trung bình và chế độ. Có một số phương pháp / trình diễn tuyệt vời có sẵn để giải thích và nắm bắt một cách trực quan - thay vì số học - hiểu về các khái niệm này, nhưng tiếc là chúng không được biết đến rộng rãi (hoặc được dạy ở trường, theo hiểu biết của tôi).
Nghĩa là:
1. Điểm cân bằng: Có nghĩa là điểm tựa
Cách tốt nhất để hiểu khái niệm nghĩa là nghĩ về nó như là điểm cân bằng trên một thanh đồng nhất. Hãy tưởng tượng một loạt các điểm dữ liệu, chẳng hạn như {1,1,1,3,3,6,7,10}. Nếu mỗi điểm này được đánh dấu trên một thanh đồng nhất và các trọng số bằng nhau được đặt tại mỗi điểm (như hình bên dưới) thì điểm tựa phải được đặt ở mức trung bình của dữ liệu để thanh cân bằng.
Trình diễn trực quan này cũng dẫn đến một giải thích số học. Lý do số học cho điều này là để điểm tựa cân bằng, tổng độ lệch âm so với giá trị trung bình (ở phía bên trái của điểm tựa) phải bằng tổng độ lệch dương so với giá trị trung bình (ở phía bên phải). Do đó, giá trị trung bình đóng vai trò là điểm cân bằng trong phân phối.
Hình ảnh này cho phép hiểu ngay về giá trị trung bình vì nó liên quan đến phân phối các điểm dữ liệu. Tính chất khác của giá trị trung bình trở nên dễ thấy từ phần trình diễn này là thực tế là giá trị trung bình sẽ luôn nằm giữa giá trị cực tiểu và cực đại trong phân phối. Ngoài ra, có thể dễ dàng hiểu được ảnh hưởng của các ngoại lệ - rằng sự hiện diện của các ngoại lệ sẽ làm thay đổi điểm cân bằng, và do đó, tác động đến giá trị trung bình.
2. Giá trị phân phối lại (chia sẻ công bằng)
Một cách thú vị khác để hiểu ý nghĩa là nghĩ về nó như một giá trị phân phối lại . Việc giải thích này đòi hỏi một số hiểu biết về số học đằng sau việc tính giá trị trung bình, nhưng nó sử dụng một chất lượng nhân học - cụ thể là khái niệm phân phối lại xã hội chủ nghĩa - để nắm bắt trực giác khái niệm về giá trị trung bình.
Việc tính toán giá trị trung bình bao gồm tổng hợp tất cả các giá trị trong một phân phối (tập hợp các giá trị) và chia tổng cho số điểm dữ liệu trong phân phối.
x¯= ( ∑i = 1nxTôi) / n
Một cách để hiểu cơ sở lý luận đằng sau tính toán này là nghĩ về mỗi điểm dữ liệu là táo (hoặc một số mặt hàng có thể bị nấm khác). Sử dụng ví dụ tương tự như trước đây, chúng tôi có tám người trong mẫu của chúng tôi: {1,1,1,3,3,6,7,10}. Người thứ nhất có một quả táo, người thứ hai có một quả táo, v.v. Bây giờ, nếu một người muốn phân phối lại số lượng táo sao cho đó là công bằng cho mọi người, bạn có thể sử dụng giá trị trung bình của phân phối để thực hiện việc này. Nói cách khác, bạn có thể đưa ra bốn quả táo (nghĩa là giá trị trung bình) cho mọi người để phân phối được công bằng / bằng nhau. Trình diễn này cung cấp một lời giải thích trực quan cho công thức trên: chia tổng phân phối cho số điểm dữ liệu tương đương với phân vùng toàn bộ phân phối cho tất cả các điểm dữ liệu.
3. Ghi nhớ trực quan
Những cách ghi nhớ trực quan sau đây cung cấp việc giải thích ý nghĩa theo một cách duy nhất:
Đây là một bản ghi nhớ cho việc giải thích giá trị cân bằng của giá trị trung bình. Chiều cao của thanh ngang A là giá trị trung bình của độ cao của bốn chữ cái.
Và đây là một cách ghi nhớ khác cho việc giải thích điểm cân bằng của giá trị trung bình. Vị trí của điểm tựa gần như là giá trị trung bình của các vị trí của M, E và nhân đôi N.
Trung bình
Một khi giải thích ý nghĩa là điểm cân bằng trên một thanh được hiểu, trung vị có thể được chứng minh bằng một phần mở rộng của cùng một ý tưởng: điểm cân bằng trên vòng cổ .
Thay thế thanh bằng một chuỗi, nhưng giữ các đánh dấu và trọng lượng dữ liệu. Sau đó, ở hai đầu, gắn một chuỗi thứ hai, dài hơn chuỗi thứ nhất, để tạo thành một vòng [giống như vòng cổ] và treo vòng trên một ròng rọc được bôi trơn tốt.
Giả sử, ban đầu, các trọng số là khác biệt. Cân bằng ròng rọc và vòng lặp khi có cùng số lượng trọng lượng cho mỗi bên. Nói cách khác, vòng lặp 'cân bằng' khi trung vị là điểm thấp nhất.
Lưu ý rằng nếu một trong các trọng số trượt lên trên vòng lặp tạo ra ngoại lệ, thì vòng lặp không di chuyển. Điều này chứng tỏ, về mặt vật lý, nguyên tắc rằng trung vị không bị ảnh hưởng bởi các ngoại lệ.
Chế độ
Chế độ có lẽ là khái niệm dễ hiểu nhất vì nó liên quan đến hoạt động toán học cơ bản nhất: đếm. Thực tế là nó tương đương với điểm dữ liệu xảy ra thường xuyên nhất dẫn đến một từ viết tắt: Từ M xương - thường là O tạo ra D ata E lement.
Chế độ cũng có thể được coi là giá trị tiêu biểu nhất trong một bộ. (Mặc dù, sự hiểu biết sâu sắc hơn về 'điển hình' sẽ dẫn đến giá trị đại diện hoặc giá trị trung bình. Tuy nhiên, nó phù hợp để đánh đồng 'điển hình' với chế độ dựa trên ý nghĩa rất chính xác của từ 'điển hình'.)
Nguồn:
- The Median là một điểm cân bằng - Lynch, Tạp chí toán học đại học (2009)
- Làm cho số liệu thống kê trở nên đáng nhớ: Những kỷ niệm và động lực mới - Ít hơn, Giáo dục thống kê, JSM (2011)
- Về việc Sử dụng Ghi nhớ cho Thống kê Giảng dạy - Ít hơn, Ứng dụng và Thống kê được Hỗ trợ theo Mô hình, 6 (2), 151-160 (2011)
- Nghĩa là gì? - Watier, Lamontagne và Chartier, Tạp chí Giáo dục Thống kê, Tập 19, Số 2 (2011)
- Điển hình? Ý tưởng của trẻ em và giáo viên về trung bình - Russell và Mokros, ICOTS 3 (1990) TÀI LIỆU THAM KHẢO: http://www.amstat.org/publications/jse/v22n3/lesser.pdf