Tôi có một bảng có hai cột X và Y. Mỗi hàng biểu thị một thống kê tổng hợp cho một thể hiện. Tôi giới thiệu một cột mới là Z = X / Y, đây là một thông tin quan trọng khác. Bây giờ, tôi muốn trình bày số liệu thống kê tổng thể của các trường hợp (nghĩa là Trung bình).
Ở đây tôi có một mối quan tâm: Tôi nên sử dụng cái nào trong số Nghĩa (X / Y) và Trung bình (X) / Trung bình (Y) để đại diện cho Ý nghĩa của Z? Đơn giản, nó có thể có nghĩa là (X / Y) chỉ vì Z = X / Y.
Tuy nhiên, tôi có hai mối quan tâm:
- Trung bình (Y) * Trung bình (Z)! = Trung bình (X); nó làm cho mọi người khó tin vào những con số
- sự khác biệt giữa Trung bình (X / Y) và Trung bình (X) / Trung bình (Y) là đáng kể. Có phải sự khác biệt tự nói lên một cái gì đó có ý nghĩa thống kê?
// Tôi cập nhật trường hợp của tôi.
Bảng giữ hồ sơ người dùng trên một hệ thống. Người dùng có thể tải dữ liệu lên nó.
- X: số lượt tải lên
- Y: khối lượng tải lên
- Z: Y / X; khối lượng mỗi lần tải lên
Những gì tôi muốn làm là mô phỏng một hệ thống như vậy với khối lượng công việc tương tự như thực tế.
Tôi chỉ đơn giản tạo N phiên bản người dùng (N không thể quá lớn) với X '= Trung bình (X) và Z' = Trung bình (Z).
Vì vậy, trong quá trình mô phỏng, mỗi người dùng tải lên dữ liệu có tổng khối lượng: (X ') * (Z').
Sau đó, khi tôi tổng hợp các kết quả mô phỏng, tôi kết thúc bằng: Trung bình (Y ')! = Trung bình (Y).