Bỏ qua các câu trả lời khác ở đây. Đây thực sự không phải là một nghịch lý. Vấn đề thực tế trong tầm tay đây mà tất cả mọi người dường như bị bỏ qua là bạn đang nhầm mà khả năng bạn đang thực sự nhìn vào. Trên thực tế, có hai mức trung bình và thống kê hoàn toàn khác nhau đang diễn ra ở đây, cả hai đều có cách sử dụng và diễn giải riêng trong ví dụ đề xuất của bạn (tiếp thị)!
Trước hết là số lượng sản phẩm trung bình được mua cho mỗi khách hàng. Vì vậy, trung bình, một khách hàng mua 1,6 mặt hàng. Tất nhiên, một khách hàng không thể trừ 0,6 sản phẩm (giả sử đó không phải là gạo hoặc ngũ cốc có số đo liên tục với nó).
Thứ hai, có số lượng khách hàng trung bình mua một sản phẩm cụ thể. Nghe có vẻ lạ đúng không? Vì vậy, trung bình một sản phẩm có 5.33333333 ... khách hàng mua nó. Điều này là khác nhau tuy nhiên. Những gì chúng tôi mô tả ở đây không phải là số lượng sản phẩm được mua (chỉ có ba trong số đó!) Mà là số người thực sự mua sản phẩm nói trên.
Hãy nghĩ về hai giá trị theo cách này: hai giá trị này sẽ đại diện cho điều gì nếu chỉ có một khách hàng hoặc chỉ có một sản phẩm? Xét cho cùng, trung bình của một điểm dữ liệu duy nhất chỉ là điểm dữ liệu đã cho.
Hoặc tốt hơn nữa, hãy nghĩ về biểu đồ như thể nó đang cho bạn số tiền đô la đã bỏ ra để mua sản phẩm. Rõ ràng số tiền trung bình được chi tiêu bởi một khách hàng cá nhân sẽ ít hơn nhiều so với số tiền kiếm được trung bình bởi một sản phẩm được cung cấp bởi một tập đoàn lớn (hoặc thậm chí chỉ là một doanh nghiệp nhỏ). Tôi chắc rằng bạn có thể nghĩ ra những cách tốt để sử dụng cả hai giá trị khi thảo luận về sự thịnh vượng của công ty.
Khi bạn đi giải thích điều này với nhân viên tiếp thị, hãy giải thích cho họ giống như tôi đã nói. Đó không phải là một nghịch lý. Đó chỉ là một thống kê hoàn toàn khác. Vấn đề duy nhất ở đây là nhận thấy rằng trên thực tế, có hai cách khác nhau để đọc biểu đồ (nghĩa là số người mua trên mỗi sản phẩm so với số sản phẩm được mua cho mỗi người).
tl; dr điều đầu tiên bạn mô tả là số tiền trung bình mà một khách hàng cá nhân sẵn sàng bỏ ra để mua sản phẩm của bạn. Thứ hai là nhu cầu trung bình cho một sản phẩm nhất định của công chúng. Tôi chắc chắn bạn có thể thấy bây giờ tại sao cả hai chắc chắn không giống nhau. So sánh chúng như vậy sẽ chỉ cung cấp cho bạn thông tin rác.
CHỈNH SỬA
Nó sẽ xuất hiện câu hỏi thực sự là hỏi về số tiền trung bình được chi tiêu bởi các khách hàng mua một số sản phẩm a, b hoặc c. Ổn thỏa. Đây thực sự chỉ là một lỗi trong tính toán. Tôi sẽ không gọi đây là một nghịch lý. Nó thực sự chỉ là một flub tinh tế.
Nhìn vào cột của bạn. Có những người được chia sẻ giữa các cột. Giả sử bạn đã làm một trung bình có trọng số phù hợp . Bạn vẫn đang thêm người hai lần. Điều này có nghĩa là trung bình sẽ chứa thêm người có giá trị lớn hơn hoặc bằng 2. Bây giờ mức trung bình của bạn là bao nhiêu? Đó là 1.6! Về bản chất, trung bình của bạn trông như thế này:
Σni = 0v a l u e O fPe r s o ntôi∗ v a l u e O fPe r s o ntôin
Đó chắc chắn không phải là công thức đúng. Đó là một mức trung bình có trọng số mặc dù giả sử loại trừ lẫn nhau đó là cách bạn sẽ điều chỉnh để có được mức trung bình thực trong tình huống của mình.
Σni = 0n u m b e r O fPe o p l e B u ytôi n gtôi* Một v e r một ge Sp e n t B yPe r s o n B u ytôi n gtôin
Dù bằng cách nào, bạn sẽ nhận được một trung bình lộn xộn. Một sai lầm là bỏ qua sự cần thiết phải có trung bình có trọng số vì một loại có "trọng số" lớn hơn về mức trung bình. Nó giống như mật độ. Một giá trị dày đặc hơn ở người đại diện. Vấn đề khác là trùng lặp thêm sẽ làm biến dạng trung bình. Tôi không gọi một trong hai "nghịch lý" này. Khi tôi nhìn thấy những gì bạn đang làm, có vẻ như rõ ràng với tôi tại sao điều đó sẽ không hiệu quả. Trung bình có trọng số có phần tự giải thích cho nhu cầu của nó và tôi nghĩ bây giờ bạn thấy rằng bạn đã thêm các giá trị nhiều lần ... không thể hoạt động. Về cơ bản, bạn lấy trung bình của bình phương các giá trị của chúng.