Giá trị trung bình của một tập hợp các phương tiện sẽ luôn giống với giá trị trung bình thu được từ toàn bộ tập hợp dữ liệu thô?


10

Nếu tôi đã tính giá trị trung bình của 4 bộ dữ liệu (có các cỡ mẫu khác nhau), thì tôi có thể lấy "giá trị trung bình chung" bằng cách tính "giá trị trung bình của phương tiện" không? Nếu có, "giá trị trung bình của phương tiện" này có giống như khi tôi kết hợp dữ liệu từ cả 4 bộ và sau đó tính giá trị trung bình không?


3
Bạn đã thử cả hai cách ;-)? (Số)
gung - Phục hồi Monica

Câu trả lời:


14

Không, trung bình của mức trung bình của các tập hợp con không giống với mức trung bình của toàn bộ tập hợp. Nó sẽ chỉ có cùng giá trị nếu các tập hợp con có cùng cỡ mẫu. Nếu bạn muốn trung bình của dân số, nhân mỗi trung bình với kích thước của mẫu mà nó xuất phát để lấy tổng dân số, sau đó chia cho tổng số điểm dữ liệu (kích thước dân số).

Xem ví dụ về mức trung bình của cú đánh trên nghịch lý của Simpson để có một minh họa tốt về lý do tại sao mức trung bình trung bình thường không hoạt động.


2

Hãy thử nó và xem nếu chúng ta có thể tìm ra nó. Ví dụ sau được mã hóa R, miễn phí và sẽ cho phép bạn sao chép ví dụ, nhưng hy vọng mã này tự giải thích:

group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
#  2
mean(group2)
#  6.5
mean(c(group1, group2))
#  5
mean(c(mean(group1), mean(group2)))
#  4.25

Vì vậy, những gì chúng ta thấy là bạn chắc chắn có thể tính được giá trị trung bình của phương tiện, nhưng giá trị trung bình của phương tiện và giá trị trung bình của tất cả các dữ liệu thô không khớp. Chúng tôi cũng có thể thử mức trung bình có trọng số bằng cách sử dụng đề xuất của @ BilltheLizard để sử dụng kích thước mẫu của mỗi nhóm làm trọng số (các trọng số được biểu thị bằng wđối số):

weighted.mean(c(mean(group1), mean(group2)), w=c(3,6))
#  5

Điều này bây giờ cho chúng ta cùng một câu trả lời.


1

Nói chung, nếu bạn có một tập hợp các nhóm với kích thước tương ứng và có nghĩa là thì trung bình mẫu của tất cả dữ liệu là :mn1,...,nmx¯1,...,x¯m

x¯= =Σk= =1mnknx¯kn= =ΣTôi= =1mnk.

Do đó, trung bình tổng thể luôn là trung bình có trọng số của các phương tiện mẫu của các nhóm. Trong trường hợp đặc biệt khi tất cả các nhóm có cùng kích thước ( ), tất cả các trọng số sẽ giống nhau và do đó, trung bình mẫu tổng thể sẽ là giá trị trung bình của phương tiện mẫu nhóm.n1= == =nm


0

Chỉ muốn đưa ra một ví dụ (cực kỳ): nếu chúng ta có tỷ lệ trúng (1/10000) trong một mẫu và tỷ lệ trúng (1/2) trong một ví dụ khác, thì . Trong trường hợp đầu tiên (trung bình của phương tiện), chúng tôi có tỷ lệ trúng "trung bình" là 0,5001 / 2 trong khi trong trường hợp thứ hai (trung bình của tổng số) chúng tôi có 3/10003 và hai số này không giống nhau. Việc một cái phù hợp hơn hay chính xác hơn tùy thuộc vào trường hợp sử dụng của bạn.ΣhTôitTôitotmộttôiTôiΣhTôitTôiΣtotmộttôiTôi

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.