Chính xác thì nó có nghĩa gì với 'dữ liệu nhóm'?


16

Tôi nghĩ rằng 'gộp dữ liệu' chỉ đơn giản là kết hợp dữ liệu trước đây được chia thành các danh mục ... về cơ bản, bỏ qua các danh mục và làm cho dữ liệu đặt thành một 'nhóm' dữ liệu khổng lồ. Tôi đoán đây là một câu hỏi về thuật ngữ nhiều hơn là áp dụng số liệu thống kê.

Ví dụ: Tôi muốn so sánh 2 trang web và trong mỗi trang web tôi có hai loại năm (tốt và kém). Nếu tôi muốn so sánh 2 trang web 'tổng thể' (nghĩa là bỏ qua các loại năm), có đúng không khi nói rằng tôi đang gộp dữ liệu trong mỗi trang web? Ngoài ra, do nhiều năm dữ liệu bao gồm các loại năm tốt và nghèo, liệu có đúng không khi nói rằng tôi đang tập hợp dữ liệu giữa các năm để đạt được dữ liệu 'năm tốt' và 'năm nghèo' trong mỗi trang web? Cảm ơn bạn đã giúp đỡ! Mog

Câu trả lời:


13

Vâng, ví dụ của bạn là chính xác.

Từ điển tiếng Anh Oxford định nghĩa nhóm là:

hồ bơi, v.

(ːl)

1.1 trans. Ném vào một cổ phiếu hoặc quỹ chung để được phân phối theo thỏa thuận; kết hợp (vốn hoặc lợi ích) vì lợi ích chung; thông số kỹ thuật của các công ty đường sắt cạnh tranh, vv.: Để chia sẻ hoặc phân chia (giao thông hoặc biên lai).

Một ví dụ khác là:

bạn đo nồng độ chất X trong máu ở nam và nữ. Bạn không thấy sự khác biệt thống kê giữa hai nhóm để bạn gộp dữ liệu lại với nhau , bỏ qua giới tính của đối tượng thử nghiệm.

Cho dù đó là chính xác về mặt thống kê để làm như vậy phụ thuộc rất nhiều vào trường hợp cụ thể.


12

Pooling có thể đề cập đến việc kết hợp dữ liệu, nhưng nó cũng có thể đề cập đến việc kết hợp thông tin hơn là dữ liệu thô. Một trong những cách sử dụng phổ biến nhất của việc gộp chung là trong việc ước tính phương sai. Nếu chúng ta tin rằng 2 quần thể có cùng phương sai, nhưng không có nghĩa là giống nhau, thì chúng ta có thể tính 2 ước tính của phương sai từ các mẫu của 2 nhóm, sau đó gộp chúng (lấy trung bình có trọng số) để có được ước tính duy nhất phương sai chung. Chúng tôi không tính toán một ước tính duy nhất về phương sai từ dữ liệu kết hợp bởi vì nếu phương tiện không bằng nhau thì điều đó sẽ làm tăng ước tính phương sai.


Cảm ơn @Greg. Để làm rõ (vì tôi đang cố gắng kết hợp các phương sai cũng như từ tài liệu), điều bạn đang nói là để có được phương sai 'trung bình' cho nhiều quần thể, tôi có thể lấy phương sai tính toán có trọng số không? Làm thế nào tôi có thể cân những phương sai đó? Không phải mỗi dân số = 1 sao?
Mog

Nếu kích thước mẫu bằng nhau, thì trung bình đơn giản có xu hướng hoạt động. Nói chung, chúng tôi cho mỗi điểm dữ liệu có trọng số bằng nhau, công thức tiêu chuẩn là nhân mỗi phương sai với bậc tự do (hoặc số trong mẫu số cho hơn nhóm, n-1), sau đó tổng tất cả các phần, sau đó chia cho tổng mức độ tự do (tất cả các n_i-1).
Greg Snow
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.