Tôi nghĩ rằng trung bình có nghĩa.
Đây có phải là trường hợp?
Tôi nghĩ rằng trung bình có nghĩa.
Đây có phải là trường hợp?
Câu trả lời:
Đó là một câu hỏi không cần thiết (chắc chắn không tầm thường như những người hỏi câu hỏi dường như nghĩ).
Khó khăn cuối cùng là do thực tế là chúng ta không thực sự biết ý nghĩa của chúng ta về "sự sai lệch" - rất nhiều lúc nó là điều hiển nhiên, nhưng đôi khi nó thực sự không. Do khó khăn trong việc xác định ý nghĩa của chúng tôi về 'vị trí' và 'lan truyền' trong các trường hợp không cần thiết (ví dụ: ý nghĩa không phải lúc nào cũng có nghĩa là khi chúng tôi nói về vị trí), sẽ không có gì ngạc nhiên khi một người tinh tế hơn khái niệm như xiên ít nhất là trơn. Vì vậy, điều này dẫn chúng ta thử các định nghĩa đại số khác nhau về ý nghĩa của chúng ta và chúng không luôn đồng ý với nhau.
1) Nếu bạn đo độ lệch của hệ số Pearson thứ hai độ lệch , sau đó giá trị trung bình ( ) sẽ ít hơn so với mức trung bình ( ~ μ - tức là trong trường hợp này bạn có nó ngược).
Các (dân số) thứ hai Pearson độ lệch là Và sẽ được tiêu cực ( "trái nghiêng") khi μ < ~ μ .
Các phiên bản mẫu của các thống kê này hoạt động tương tự.
Lý do cho mối quan hệ cần thiết giữa giá trị trung bình và trung bình trong trường hợp này là bởi vì đó là cách đo độ lệch được xác định.
Đây là mật độ lệch trái (bằng cả biện pháp Pearson thứ hai và biện pháp phổ biến hơn trong (2) bên dưới):
Trung vị được đánh dấu ở lề dưới màu xanh lá cây, trung bình màu đỏ.
Vì vậy, tôi mong đợi câu trả lời họ muốn bạn đưa ra là giá trị trung bình ít hơn trung bình. Nó thường là trường hợp với các loại phân phối mà chúng ta có xu hướng đặt tên.
(Nhưng hãy đọc tiếp và xem tại sao điều đó không thực sự đúng như một tuyên bố chung.)
2) Nếu bạn đo nó bằng khoảnh khắc thứ ba được chuẩn hóa thông thường hơn , thì nó thường, nhưng không phải lúc nào cũng vậy, trường hợp giá trị trung bình sẽ nhỏ hơn trung vị.
Đó là, có thể xây dựng các ví dụ trong đó điều ngược lại là đúng hoặc trong đó một số đo độ lệch bằng 0 trong khi số kia là khác không.
Điều đó có nghĩa là, không có mối quan hệ cần thiết giữa các vị trí của giá trị trung bình, trung bình và độ lệch.
Ví dụ, xem xét mẫu sau (ví dụ tương tự có thể được xây dựng dưới dạng phân phối xác suất rời rạc):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
Tuy nhiên, hệ số xiên (Fisher, giây thứ ba) là âm (tức là bằng đèn của nó, chúng ta có dữ liệu lệch trái) do tổng các khối của độ lệch so với giá trị trung bình là âm.
Vì vậy, trong trường hợp đó, nghiêng trái, nhưng có nghĩa là> trung vị.
(Mặt khác, nếu bạn thay đổi 2,7 trong ví dụ trên thành 3, thì bạn có một ví dụ trong đó độ lệch thời điểm bằng 0, nhưng giá trị trung bình vượt quá trung bình. Nếu bạn làm cho nó 3,3, thì độ lệch thời điểm là dương và giá trị trung bình vượt quá trung vị - nghĩa là cuối cùng theo hướng 'dự đoán'.)
Nếu bạn sử dụng độ lệch Pearson đầu tiên thay vì một trong hai định nghĩa trên, bạn có một vấn đề tương tự với trường hợp này - hướng của độ lệch không xác định mối quan hệ giữa trung bình và trung bình nói chung.
Chỉnh sửa: trong câu trả lời cho một câu hỏi trong các bình luận - một ví dụ trong đó giá trị trung bình và trung bình bằng nhau, nhưng độ lệch thời gian là âm. Hãy xem xét các dữ liệu sau đây (như trước đây, nó cũng được tính là một ví dụ cho một dân số rời rạc; xem xét việc viết các số trên khuôn mặt của một con súc sắc).
1 5 6 6 8 10
giá trị trung bình và trung vị đều là 6, nhưng tổng các khối sai lệch so với giá trị trung bình là âm, vì vậy độ lệch của giây thứ ba là âm.
Không. Dữ liệu lệch trái có đuôi dài ở bên trái (đầu thấp) nên giá trị trung bình thường sẽ nhỏ hơn trung vị. (Nhưng hãy xem câu trả lời của @Glen_b để biết ngoại lệ). Tình cờ, tôi nghĩ rằng dữ liệu "trông" bị lệch sẽ có nghĩa ít hơn trung bình.
Dữ liệu lệch phải là phổ biến hơn; ví dụ, thu nhập. Có nghĩa là lớn hơn trung bình.
Mã R
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001