Câu hỏi này đưa ra rất nhiều trong nhiều vỏ bọc khác nhau. Những gì phổ biến với họ là
Làm cách nào tôi có thể kết hợp các thống kê dựa trên khoảnh khắc đã được tính toán từ các tập hợp con khác nhau của dữ liệu của tôi?
Ứng dụng đơn giản nhất liên quan đến dữ liệu đã được chia thành hai nhóm. Bạn biết kích thước nhóm và ý nghĩa của nhóm. Xét riêng về bốn đại lượng này, ý nghĩa tổng thể của dữ liệu là gì?
Các ứng dụng khác khái quát hóa từ phương tiện đến phương sai, độ lệch chuẩn, ma trận hiệp phương sai, độ lệch và thống kê đa biến; và có thể liên quan đến nhiều nhóm dữ liệu. Lưu ý rằng nhiều trong số các đại lượng này là sự kết hợp hơi phức tạp của các khoảnh khắc: ví dụ độ lệch chuẩn là căn bậc hai của tổ hợp bậc hai của khoảnh khắc thứ nhất và giây (bình phương trung bình và trung bình).
Tất cả các trường hợp như vậy được xử lý dễ dàng bằng cách giảm các khoảnh khắc khác nhau thành tổng, vì các khoản tiền rõ ràng và dễ dàng kết hợp: chúng được thêm vào. Về mặt toán học, nó thuộc về điều này: bạn có một lô dữ liệuđã được tách thành các nhóm kích thước khác nhau:. Hãy gọinhóm thứ. Theo định nghĩa, thời điểm thứcủa bất kỳ lô dữ liệulà trung bình củaX=(x1,x2,…,xn)j1,j2,…,jg(x1,x2,…,xj1;xj1+1,…,xj1+j2;xj1+j2+1,…;…;…,xn)iX(i)=(xji+1,xji+2,…,xji+1)ky1,…,yjkquyền hạn thứ,
μk(y)=(yk1+yk2+⋯+ykj)/j.
Rõ ràng là tổng của sức mạnh thứ . Do đó, đề cập đến việc phân tách dữ liệu trước đây của chúng tôi thành các nhóm con , chúng tôi có thể chia một tổng số sức mạnh thành các nhóm tổng, thu đượcjμk(y)kgn
nμk(X)=(xk1+xk2+⋯+xkn)=(xk1+xk2+⋯+xkj1)+⋯+(xkj1+⋯+jg−1+1+xkj1+⋯+jg−1+2+⋯+xkn)=j1μk(X(1))+j2μk(X(2))+⋯+jgμk(X(g)).
Chia cho thể hiện khoảnh khắc thứ của toàn bộ lô về thời điểm thứ của các nhóm con của nó.nkk
Trong ứng dụng hiện tại, các mục trong ma trận hiệp phương sai, tất nhiên, là hiệp phương sai, có thể biểu thị theo các khoảnh khắc thứ hai đa biến và khoảnh khắc đầu tiên. Phần chính của phép tính được đưa ra là: ở mỗi bước bạn sẽ tập trung vào hai thành phần cụ thể của dữ liệu đa biến của bạn; hãy gọi họ là và . Các số bạn đang xem có dạngxy
((x1,y1),(x2,y2),…,(xn,yn)),
chia tay như trước thành nhóm . Đối với mỗi nhóm, bạn biết tổng số sản phẩm trung bình của : đây là khoảnh khắc đa biến , . Để kết hợp các giá trị nhóm này, bạn sẽ nhân chúng với kích thước nhóm, cộng các kết quả đó và chia tổng số cho .gxiyi(1,1)μ(1,1)n
Để áp dụng phương pháp này, bạn cần suy nghĩ trước : không thể kết hợp, giả sử hiệp phương sai nếu bạn chỉ biết hiệp phương sai và kích thước nhóm con: bạn cũng cần biết phương tiện của các nhóm con (vì phương tiện có liên quan theo một cách thiết yếu trong tất cả các công thức hiệp phương sai), hoặc một cái gì đó đại số có thể giảm theo phương tiện. Bạn cũng có thể cần phải quan tâm đến bất kỳ hằng số nào xuất hiện trong các công thức; Cái bẫy chính cho người không sẵn sàng là nhầm lẫn một "hiệp phương mẫu" (liên quan đến tổng các sản phẩm chia cho ) với "hiệp phương sai dân số" (trong đó phép chia là ). Điều này không giới thiệu bất cứ điều gì mới; bạn chỉ cần nhớ nhân hệ số mẫu với (hoặc hiệp phương sai nhóm vớin n - 1 j i - 1 n j in−1nn−1ji−1 ) để phục hồi tổng, thay vì bằng (hoặc ).nji
Ồ, vâng: về câu hỏi hiện tại. Công thức được đưa ra trong bài viết Wikipedia được đưa ra dưới dạng phương tiện nhóm (khoảnh khắc đầu tiên) và tổng số sản phẩm của nhóm . Như tôi đã mô tả ở trên, chúng sẽ được kết hợp bằng cách thêm chúng và sau đó điều chỉnh kết quả với một phép chia để có được hiệp phương sai. Phân chia cuối cùng của không được hiển thị.n