Một câu trả lời ngắn gọn là điều này gây tranh cãi. Trái với lời khuyên mà bạn đề cập, mọi người trong nhiều lĩnh vực thường sử dụng các phương pháp quy mô và thường hạnh phúc có nghĩa là làm những gì họ muốn. Điểm trung bình hoặc tương đương trong nhiều hệ thống giáo dục là một ví dụ.
Tuy nhiên, dữ liệu thứ tự không được phân phối bình thường không phải là lý do hợp lệ, vì giá trị trung bình là
được sử dụng rộng rãi cho các bản phân phối không bình thường
được xác định tốt về mặt toán học cho rất nhiều phân phối không bình thường, ngoại trừ trong một số trường hợp bệnh lý.
Có thể không nên sử dụng giá trị trung bình trong thực tế nếu dữ liệu chắc chắn không được phân phối bình thường, nhưng điều đó khác nhau.
Một lý do mạnh mẽ hơn cho việc không sử dụng giá trị trung bình với dữ liệu thứ tự là giá trị của nó phụ thuộc vào các quy ước về mã hóa. Các mã số như 1, 2, 3, 4 thường chỉ được chọn vì đơn giản hoặc thuận tiện, nhưng về nguyên tắc, chúng có thể tương đương với 1, 23, 456, 7890 tương ứng với một thứ tự được xác định như có liên quan. Lấy ý nghĩa trong cả hai trường hợp sẽ liên quan đến việc thực hiện các quy ước đó theo nghĩa đen (cụ thể, như thể các con số không phải là tùy ý, nhưng chính đáng), và không có cơ sở nghiêm ngặt để làm điều đó. Bạn cần một thang đo khoảng trong đó sự khác biệt bằng nhau giữa các giá trị có thể được thực hiện theo nghĩa đen để biện minh cho phương tiện. Rằng tôi coi đó là đối số chính, nhưng như đã chỉ ra, mọi người thường bỏ qua nó và cố tình, bởi vì họ thấy có nghĩa là hữu ích, bất kể các nhà lý thuyết đo lường nói gì.
Đây là một ví dụ thêm. Thông thường mọi người được yêu cầu chọn một trong những "không đồng ý mạnh mẽ" ... "rất đồng ý" và (phụ thuộc một phần vào những gì phần mềm muốn) các nhà nghiên cứu mã là 1 .. 5 hoặc 0 .. 4 hoặc bất cứ điều gì họ muốn, hoặc tuyên bố nó như một yếu tố được đặt hàng (hoặc bất kỳ thuật ngữ nào phần mềm sử dụng). Ở đây mã hóa là tùy ý và ẩn từ những người trả lời câu hỏi.
Nhưng thường thì mọi người cũng được hỏi (nói) theo thang điểm từ 1 đến 5, bạn đánh giá thế nào? Ví dụ rất nhiều: trang web, thể thao, các loại thi đấu khác và thực sự là giáo dục. Ở đây mọi người đang được hiển thị một quy mô và được yêu cầu sử dụng nó. Điều này được hiểu rộng rãi rằng những người không có số nguyên có ý nghĩa, nhưng bạn chỉ được phép sử dụng số nguyên như một quy ước. Đây có phải là quy mô thứ tự? Một số người nói có, một số nói không. Mặt khác, một phần của vấn đề là quy mô thứ tự là một khu vực mờ hoặc tranh luận.
Xem xét lại các lớp cho công việc học tập, nói E đến A. Thông thường các lớp như vậy cũng được xử lý bằng số, nói từ 1 đến 5, và mọi người thường tính trung bình cho sinh viên, khóa học, trường học, v.v. và phân tích thêm dữ liệu đó. Mặc dù vẫn đúng là mọi ánh xạ tới điểm số là tùy ý nhưng có thể chấp nhận được miễn là nó giữ được trật tự, tuy nhiên trong thực tế, mọi người chỉ định và nhận điểm đều biết rằng điểm số có giá trị tương đương và biết rằng điểm sẽ được tính trung bình .
Một lý do thực tế cho việc sử dụng các phương tiện là trung bình và chế độ thường là những tóm tắt kém về thông tin trong dữ liệu. Giả sử bạn có thang đo chạy từ không đồng ý mạnh mẽ đến đồng ý mạnh mẽ và đối với mã tiện lợi, các điểm từ 1 đến 5. Bây giờ hãy tưởng tượng một mẫu được mã hóa 1, 1, 2, 2, 2 và một mẫu khác 1, 2, 2, 4, 5. Bây giờ nâng lên bàn tay của bạn nếu bạn nghĩ rằng trung vị và chế độ là những tóm tắt chính đáng duy nhất bởi vì đó là một thang đo thứ tự. Bây giờ hãy giơ tay nếu bạn thấy ý nghĩa cũng hữu ích, bất kể số tiền có được xác định rõ hay không, v.v.
Đương nhiên, giá trị trung bình sẽ là một bản tóm tắt quá mẫn nếu các mã là hình vuông hoặc hình khối từ 1 đến 5, và đó có thể không phải là điều bạn muốn. (Nếu mục đích của bạn là xác định nhanh chóng các thông số cao thì đó có thể là chính xác những gì bạn muốn!) Nhưng đó chính xác là lý do tại sao mã hóa thông thường với mã số nguyên liên tiếp là một lựa chọn thực tế, vì nó thường hoạt động khá tốt trong thực tế. Đó không phải là một cuộc tranh luận mang trọng số với các nhà lý thuyết đo lường, cũng không nên, nhưng các nhà phân tích dữ liệu nên quan tâm đến việc tạo ra các bản tóm tắt giàu thông tin.
Tôi đồng ý với bất cứ ai nói: sử dụng toàn bộ phân phối tần số lớp, nhưng đó không phải là vấn đề.