Có thể tìm thấy độ lệch chuẩn kết hợp?


32

Giả sử tôi có 2 bộ:

Đặt A : số mục , ,n=10μ=2.4σ=0.8

Đặt B : số mục , ,n=5μ=2σ=1.2

Tôi có thể dễ dàng tìm thấy giá trị trung bình kết hợp ( ), nhưng làm cách nào để tìm độ lệch chuẩn kết hợp?μ


Câu trả lời:


30

Vì vậy, nếu bạn chỉ muốn có hai trong số các mẫu này kết hợp thành một mẫu bạn có:

s1=1n1Σi=1n1(xiy¯1)2

s2=1n2Σi=1n2(yiy¯2)2

trong đó và là phương tiện mẫu và và là độ lệch chuẩn mẫu. ˉ y 2s1s2y¯1y¯2s1s2

Để thêm chúng lên, bạn có:

s=1n1+n2Σi=1n1+n2(ziy¯)2

điều này không đơn giản vì trung bình mới khác với và :ˉ y 1 ˉ y 2y¯y¯1y¯2

y¯=1n1+n2Σi=1n1+n2zi=n1y¯1+n2y¯2n1+n2

Công thức cuối cùng là:

s=n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2

Đối với phiên bản độ lệch chuẩn (" -denominator") được sử dụng phổ biến của Bessel , kết quả cho các phương tiện vẫn như trước, nhưngn1

s=(n11)s12+(n21)s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n21

Bạn có thể đọc thêm thông tin ở đây: http://en.wikipedia.org/wiki/St Chuẩn_deviation


1
Nếu OP đang sử dụng phiên bản độ lệch chuẩn ( -denominator cho phương sai) của Bessel (vì hầu hết mọi người hỏi ở đây sẽ làm), câu trả lời này sẽ không cung cấp cho họ những gì họ tìm kiếm. n1
Glen_b -Reinstate Monica

Trong trường hợp đó, phần này thực hiện các mẹo. (chỉnh sửa để liên kết với phiên bản wikipedia cũ vì nó đã bị xóa khỏi phiên bản mới)
Glen_b -Reinstate Monica

@Glen_b Bắt tốt. Bạn có thể chỉnh sửa nó thành câu trả lời để làm cho nó hữu ích hơn không?
sashkello

Tôi đã lên Wikipedia để tìm bằng chứng, nhưng tiếc là công thức này không còn nữa. Quan tâm đến việc xây dựng (bằng chứng) hoặc cải thiện Wikipedia? :)
Rauni Lillemets


8

Điều này rõ ràng mở rộng cho các nhóm :K

s=k=1K(nk1)sk2+nk(y¯ky¯)2(k=1Knk)1

7
Đây là một chút ngắn gọn theo tiêu chuẩn. Bạn có thể nói thêm một chút về cách thức này bắt nguồn và tại sao đây là câu trả lời đúng?
Sycorax nói phục hồi Monica

1

Tôi có cùng một vấn đề: có độ lệch chuẩn, phương tiện và kích thước của một số tập con có giao điểm trống, tính toán độ lệch chuẩn của liên kết của các tập hợp con đó.

Tôi thích câu trả lời của sashkelloGlen_b ♦ , nhưng tôi muốn tìm một bằng chứng về nó. Tôi đã làm nó theo cách này, và tôi để nó ở đây trong trường hợp nó là giúp đỡ cho bất cứ ai.


Vì vậy, mục đích là để thấy rằng thực sự:

S= =(n1S12+n2S22+n1(y¯1-y¯)2+n2(y¯2-y¯)2n1+n2)1/2

Từng bước một:

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

Bây giờ mẹo là nhận ra rằng chúng ta có thể sắp xếp lại các khoản tiền: vì mỗi thuật ngữ xuất hiện lần, chúng ta có thể tái viết tử số là

2y¯j=1n1xjn1
n1
i=1n1(xi2+y¯22y¯xi),

và do đó, tiếp tục với chuỗi đẳng thức:

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

Điều này đã được nói, có lẽ có một cách đơn giản hơn để làm điều này.

Công thức có thể được mở rộng đến tập con như đã nêu trước đây. Bằng chứng sẽ là cảm ứng về số lượng bộ. Trường hợp cơ sở đã được chứng minh và đối với bước cảm ứng, bạn nên áp dụng chuỗi đẳng thức tương tự cho trường hợp sau.k


Tôi không thấy câu hỏi rõ ràng như thế nào. Có phải hai bộ dữ liệu được giả định là đến từ cùng một phân phối? OP có các quan sát thực tế có sẵn hay chỉ là các ước tính mẫu về độ lệch trung bình và độ lệch chuẩn?
Michael R. Chernick

Vâng, họ được cho là đến từ cùng một phân phối. Các quan sát không có sẵn, chỉ là độ lệch trung bình và độ lệch chuẩn của các tập hợp con.
iipr

Vậy thì tại sao lại sử dụng một công thức liên quan đến các quan sát riêng lẻ?
Michael R. Chernick

Có lẽ câu trả lời của tôi không rõ ràng. Tôi chỉ đơn giản là đăng một bằng chứng toán học của công thức trên cho phép tính toán stừ độ lệch chuẩn, phương tiện và kích thước của hai tập con. Trong công thức không có tham chiếu đến các quan sát riêng lẻ. Trong bằng chứng có, nhưng nó chỉ là một bằng chứng, và theo quan điểm của tôi, đúng.
iipr
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.