Sự khác biệt về phương tiện so với sự khác biệt trung bình


10

Khi nghiên cứu hai mẫu độc lập có nghĩa là, chúng tôi được cho biết chúng tôi đang xem xét "sự khác biệt của hai phương tiện". Điều này có nghĩa là chúng tôi lấy giá trị trung bình từ dân số 1 ( ) và trừ đi giá trị trung bình từ dân số 2 ( ). Vì vậy, "sự khác biệt của hai phương tiện" của chúng tôi là ( - ).y¯1y¯2y¯1y¯2

Khi nghiên cứu các mẫu được ghép nối có nghĩa là, chúng tôi được cho biết chúng tôi đang xem xét "sự khác biệt trung bình", . Điều này được tính bằng cách lấy sự khác biệt giữa mỗi cặp, và sau đó lấy giá trị trung bình của tất cả những khác biệt đó.d¯

Câu hỏi của tôi là: Chúng ta có nhận được cùng một ( - ) so với nếu chúng ta tính toán chúng từ hai cột dữ liệu và lần đầu tiên coi đó là hai mẫu độc lập và lần thứ hai coi nó được ghép nối dữ liệu? Tôi đã chơi xung quanh với hai cột dữ liệu và dường như các giá trị là như nhau! Trong trường hợp đó, có thể nói rằng các tên khác nhau được sử dụng cho các lý do không định lượng?y¯1y¯2d¯


2
Hãy suy nghĩ về nó theo cách này: làm thế nào bạn sẽ tính toán với dữ liệu chưa ghép? d¯
Shadowtalker

3
@ssdecontrol Đặc biệt nếu kích thước mẫu khác nhau.
Alexis

Câu trả lời:


11

(Tôi cho rằng bạn có nghĩa là "mẫu" chứ không phải "dân số" trong đoạn đầu tiên của bạn.)

Sự tương đương là dễ dàng để hiển thị về mặt toán học. Bắt đầu với hai mẫu có kích thước bằng nhau, và . Sau đó, xác định{x1,,xn}{y1,,yn}

x¯=1ni=1nxiy¯=1ni=1nyid¯=1ni=1nxiyi

Sau đó, bạn có:

x¯y¯=(1ni=1nxi)(1ni=1nyi)=1n(i=1nxii=1nyi)=1n((x1++xn)(y1++yn))=1n(x1++xny1yn)=1n(x1y1++xnyn)=1n((x1y1)++(xnyn))=1ni=1nxiyi=d¯.

1
Nhưng hai khoảng tin cậy được tính cho "sự khác biệt của phương tiện" và "sự khác biệt trung bình" sẽ khác nhau, phải không? Điều này có thể được nhìn thấy bằng cách nhìn vào và . Một "sự khác biệt trung bình" được ghép nối sẽ khác nhau đối với (tất cả đều bằng 0) so với (không phải là tất cả bằng 0); sự khác biệt của phương tiện không bị ảnh hưởng bởi thứ tự của các yếu tố. A=[1,2,3,4,5,...]B=[...,5,4,3,2,1]AAAB
bers

Không thể chỉnh sửa bài viết trước của tôi nữa. Câu thứ 3 sẽ bắt đầu "Một chuỗi các cặp 'có nghĩa là khác biệt' ..."
bers

@bers phải làm gì với nó? AA
Shadowtalker

Giả sử . Khi đó và là hai chuỗi khác nhau. Khoảng tin cậy cho chênh lệch trung bình được ghép đôi chắc chắn sẽ khác nhau trong cả hai trường hợp. Nhưng sự khác biệt của các phương tiện, và do đó, khoảng tin cậy, sẽ được thụt vào cả và . Hoặc là tôi sai? C=AACABACAB
bers

@bers Tôi nghĩ bạn đang bối rối, nhưng tôi bối rối không biết bạn đang bối rối về điều gì.
Shadowtalker

0

phân phối của sự khác biệt trung bình nên chặt chẽ hơn sau đó phân phối sự khác biệt của phương tiện. Xem điều này với một ví dụ dễ hiểu: trung bình trong mẫu 1: 1 10 100 1000 có nghĩa là trong mẫu 2: 2 11 102 1000 sự khác biệt của phương tiện là 1 1 2 0 (không giống như mẫu) có tiêu chuẩn nhỏ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.