Một số câu trả lời tốt vẫn còn chừa chỗ cho nhiều ý kiến hơn.
Đầu tiên, không ai phản đối ý kiến cho rằng trung vị là nhằm loại bỏ các ngoại lệ, nhưng tôi sẽ đủ điều kiện. Ý nghĩa dự định là hiển nhiên, nhưng dữ liệu thực tế lại phức tạp hơn. Nhiều nhất, trung vị được dự định giảm giá hoặc bỏ qua các ngoại lệ, nhưng ngay cả điều đó không được đảm bảo. Ví dụ: với xếp hạng 1 1 1 5 5 5 trung bình và trung bình đồng ý ở mức 3, vì vậy tất cả có vẻ tốt. Nhưng thêm 5 sẽ đưa trung bình lên 5 và thêm 1 sẽ đưa trung bình lên 1. Trung bình sẽ di chuyển khoảng 0,286 trong mỗi trường hợp. Do đó, giá trị trung bình ở đây là kháng hơn so với trung bình. Ví dụ có thể được bác bỏ là không bình thường, nhưng nó không thái quá. Điểm không phải là bản gốc, tự nhiên. Một nơi nó được tạo ra là ở Mosteller, F. và Tukey, JW 1977. Phân tích và hồi quy dữ liệu. Đọc, MA: Addison-Wesley, tr.34-35.
Thứ hai, phương tiện cắt tỉa đã được đề cập và ý tưởng xứng đáng được thúc đẩy lớn hơn. Trung bình và trung bình không cần phải là lựa chọn thay thế rõ ràng để nhà phân tích phải chọn (bỏ phiếu cho) cái này hay cái khác. Bạn có thể xem xét tất cả các phương tiện được cắt tỉa có thể dựa trên việc cắt xén một số giá trị nhất định trong mỗi đuôi . Bảng hiển thị dưới dạng # số lượng giá trị được bao gồm trong phép tính giá trị trung bình:
+----------------------------+
| number # trimmed mean |
|----------------------------|
| 0 16 4.0625 |
| 1 14 4.214286 |
| 2 12 4.416667 |
| 3 10 4.6 |
| 4 8 4.75 |
| 5 6 4.833333 |
| 6 4 5 |
| 7 2 5 |
+----------------------------+
Bức tranh chính ở đây là bạn có thể chọn tỷ lệ chiết khấu của mình (bỏ qua rất nhiều giá trị ở mỗi đuôi là nghi ngờ) như một loại bảo hiểm chống lại rủi ro bị tắt vì giá trị cực đoan. Những gì tôi thấy là một độ dốc khá mịn giữa giá trị trung bình và trung bình, được dự kiến ở đây vì các giá trị có thể 1, 2, 3, 4, 5 đều có trong dữ liệu. Một bước nhảy lớn trong chuỗi được dự kiến với một ngoại lệ bị cô lập.
Không có nghĩa vụ với các phương tiện cắt xén để cắt số lượng bằng nhau ở mỗi đuôi, nhưng tôi sẽ không mở rộng về điều đó.
Thứ ba, ví dụ là các đánh giá của Amazon. Bối cảnh luôn thích hợp trong việc hướng dẫn cách bạn muốn dữ liệu được tóm tắt . Trong trường hợp Amazon đánh giá, câu trả lời tốt nhất là đọc các đánh giá! Vì điểm cao và điểm thấp có thể giống nhau trên cơ sở giả mạo (ngầm: tác giả của cuốn sách này là bạn của tôi) và / hoặc không liên quan đến quyết định của bạn (rõ ràng: người bán lại đối xử tệ với tôi), không rõ ràng với tôi hàm ý về cách tóm tắt dữ liệu đó và thực sự bằng cách hiển thị cho bạn phân phối Amazon đang được cung cấp thông tin tối đa.
Thứ tư, và cơ bản nhất nhưng cũng cơ bản của tất cả, ai đang khiến bạn chọn? Đôi khi cả trung bình và trung bình nên được báo cáo (và, như đã nói, một biểu đồ phân phối quá).