Tại sao mẫu số của công cụ ước lượng hiệp phương sai không phải là n-2 chứ không phải n-1?


36

Mẫu số của công cụ ước lượng phương sai (không thiên vị) là vì có quan sát và chỉ có một tham số được ước tính.n1n

V(X)=i=1n(XiX¯)2n1

Với cùng một mã thông báo, tôi tự hỏi tại sao không nên mẫu số của hiệp phương sai là khi hai tham số đang được ước tính?n2

Cov(X,Y)=i=1n(XiX¯)(YiY¯)n1

15
Nếu bạn đã làm điều đó, bạn sẽ có hai định nghĩa mâu thuẫn với phương sai: một sẽ là công thức đầu tiên và người kia sẽ là công thức thứ hai áp dụng với . Y=X
whuber

3
Giá trị trung bình bi / multivariate (kỳ vọng) là một, không phải 2 tham số.
ttnphns 19/03/2015

14
@ttnphns Điều đó không đúng: trung bình bivariate rõ ràng là hai tham số vì nó yêu cầu hai số thực để biểu thị nó. (Quả thực đó là một tham số vectơ đơn , nhưng nói như vậy chỉ ngụy trang thực tế là nó có hai thành phần.) Điều này hiển thị rõ ràng ở mức độ tự do cho các phép thử t-phương sai gộp, ví dụ, trong đó bị trừ, không phải . Điều thú vị về câu hỏi này là làm thế nào nó tiết lộ mức độ mơ hồ, không hấp dẫn và có khả năng gây hiểu lầm là "lời giải thích" phổ biến mà chúng tôi trừ từ vì một tham số đã được ước tính. 211n
whuber

@whuber, Bạn nói đúng đấy. Nếu chỉ có (quan sát độc lập), vấn đề chúng ta sẽ không dành nhiều df trong các thử nghiệm đa biến hơn là trong các thử nghiệm đơn biến. n
ttnphns 19/03/2015

3
@whuber: Có lẽ tôi sẽ nói rằng nó cho thấy những gì được tính là "một tham số" phụ thuộc vào tình huống. Trong trường hợp này, phương sai được tính trên quan sátn và do đó, mỗi quan sát - hoặc tổng trung bình - có thể được xem là một tham số, ngay cả khi đó là trung bình đa biến, như ttnphns nói. Tuy nhiên, trong các trường hợp khác, ví dụ khi thử nghiệm xem xét kết hợp kích thước tuyến tính, mỗi kích thước của mỗi quan sát sẽ trở thành "một tham số". Bạn đúng rằng đây là một vấn đề khó khăn.
amip nói phục hồi Monica

Câu trả lời:


31

Hiệp phương sai phương sai.

Kể từ khi nhận dạng phân cực

Cov(X,Y)=Var(X+Y2)Var(XY2),

mẫu số phải giống nhau.


20

Một trường hợp đặc biệt phải cung cấp cho bạn một trực giác; nghĩ về những điều sau đây

Cov^(X,X)=V^(X)

Bạn rất vui khi cái sau là do Sửa tàu.i=1n(XiX¯)2n1

Nhưng thay thế bằng trong cho cái trước sẽ cho , vậy bây giờ bạn nghĩ gì có thể điền vào chỗ trống tốt nhất?X ^ C o v ( X , Y ) n i = 1 ( X i - ¯ X ) ( X i - ¯ X )YXCov^(X,Y)i=1n(XiX¯)(XiX¯)mystery denominator


1
ĐƯỢC. Nhưng OP có thể hỏi "tại sao lại coi cov (X, X) và cov (X, Y) nằm trong một dòng logic? Tại sao bạn lại thay thế Y bằng X trong cov () một cách nhanh chóng? Có thể cov (X, Y) là một tình huống khác nhau? " Bạn đã không tránh khỏi điều đó, trong khi câu trả lời (được đánh giá cao) nên có, trong ấn tượng của tôi :-)
ttnphns

7

Câu trả lời nhanh và bẩn ... Trước tiên, hãy xem xét ; nếu bạn có quan sát với giá trị mong đợi bạn sẽ sử dụng để ước tính phương sai.n E ( X ) = 0 1var(X)n E(X)=01ni=1nXi2

Giá trị mong đợi chưa được biết, bạn có thể chuyển đổi các quan sát của mình thành các quan sát với giá trị dự kiến ​​đã biết bằng cách lấy cho . Bạn sẽ nhận được một công thức có trong mẫu số - tuy nhiên không độc lập và bạn phải tính đến điều này; Cuối cùng, bạn sẽ tìm thấy công thức thông thường.n - 1 A i = X i - X 1 i = 2 , Rời , n n - 1 A inn1Ai=XiX1i=2,,nn1Ai

Bây giờ đối với hiệp phương sai, bạn có thể sử dụng cùng một ý tưởng: nếu giá trị mong đợi của là , bạn sẽ có trong công thức. Bằng cách trừ cho tất cả các giá trị được quan sát khác, bạn sẽ có được quan sát với giá trị dự kiến ​​đã biết ... và một trong công thức - một lần nữa, điều này đưa ra một số sự phụ thuộc để đưa vào tài khoản.( 0 , 0 ) 1(X,Y)(0,0) (X1,Y1)n-111n(X1,Y1)n11n1

PS Cách rõ ràng để làm điều đó là chọn cơ sở trực giao của , đó là các vectơ sao cho n - 1 c 1 , ... , c n - 1R n(1,,1)n1c1,,cn1Rn

  • ijcij2=1 cho tất cả ,i
  • ijcij=0 cho tất cả ,i
  • i 1i 2jci1jci2j=0 cho tất cả .i1i2

Sau đó, bạn có thể xác định biến và . Các là độc lập, đã dự kiến giá trị , và có cùng một sai / hiệp phương sai so với các biến ban đầu.A i = j c i j X j B i = j c i j Y j ( A i , B i ) ( 0 , 0 )n1Ai=jcijXjBi=jcijYj(Ai,Bi)(0,0)

Tất cả vấn đề là nếu bạn muốn thoát khỏi sự kỳ vọng chưa biết, bạn bỏ một (và chỉ một) quan sát. Điều này hoạt động như nhau cho cả hai trường hợp.


6

Dưới đây là một bằng chứng cho thấy công cụ ước lượng hiệp phương sai mẫu p với mẫu số là một công cụ ước lượng không thiên vị của ma trận hiệp phương sai:1n1

x=(x1,...,xp) .

Σ=E((xμ)(xμ))

S=1n(xix¯)(xix¯)

Để hiển thị:E(S)=n1nΣ

Chứng minh:S=1nxixix¯x¯

Kế tiếp:

(1)E(xixi)=Σ+μμ

(2)E(x¯x¯)=1nΣ+μμ

Do đó:E(S)=Σ+μμ(1nΣ+μμ)=n1nΣ

Và do đó , với mẫu số cuối cùng , không thiên vị. Các phần tử nằm ngoài đường chéo của là hiệp phương sai mẫu riêng của bạn.1Su=nn1S Su1n1Su

Nhận xét bổ sung:

  1. Các n vẽ là độc lập. Điều này được sử dụng trong (2) để tính hiệp phương sai của giá trị trung bình mẫu.

  2. Bước (1) và (2) sử dụng thực tế làCov(x)=E[xx]μμ

  3. Bước (2) sử dụng thực tế làCov(x¯)=1nΣ


Khó khăn ở bước 2! :)
Elvis

@Elvis Nó lộn xộn. Người ta cần áp dụng quy tắc Cov (X + Y, Z) = Cov (X, Z) + Cov (Y, Z) và nhận ra rằng các lần rút khác nhau là độc lập. Sau đó, về cơ bản, nó tóm tắt hiệp phương sai n lần và thu nhỏ nó xuống 1 / n²
statchrist 19/03/2015

4

Tôi đoán một cách để xây dựng trực giác đằng sau bằng cách sử dụng 'n-1' chứ không phải 'n-2' - đó là để tính toán phương sai, chúng ta không cần định nghĩa cả X và Y, mà là cả hai, nghĩa là


Bạn có thể giải thích làm thế nào con gấu này về câu hỏi sử dụng mẫu số nào? Mối quan hệ đại số trong bằng chứng xuất phát từ thực tế là phần dư so với tổng trung bình bằng 0, nhưng mặt khác thì im lặng về mẫu số nào có liên quan.
whuber

5
Tôi đến đây vì tôi có cùng câu hỏi với OP. Tôi nghĩ rằng câu trả lời này được đưa ra ở điểm cuối của điểm @whuber đã chỉ ra ở trên: quy tắc của ngón tay cái là df ~ = n - (các tham số ước tính) có thể "mơ hồ, không hấp dẫn và có khả năng gây hiểu lầm." Điều này chỉ ra một thực tế rằng mặc dù có vẻ như bạn cần ước tính hai tham số (xbar và ybar), nhưng bạn thực sự chỉ ước tính một tham số (xbar hoặc ybar). Vì df phải giống nhau trong cả hai trường hợp, nên nó phải thấp hơn trong hai trường hợp. Tôi nghĩ đó là ý định ở đây.
mpettis

1

1) Bắt đầu .df=2n

2) Hiệp phương sai mẫu tỷ lệ với . Mất hai ; một từ , một từ dẫn đến .d f ˉ X ˉ Y d f = 2 ( n - 1 )Σi=1n(XiX¯)(YiY¯)dfX¯Y¯df=2(n1)

3) Tuy nhiên, chỉ chứa thuật ngữ riêng biệt, một thuật ngữ từ mỗi sản phẩm. Khi hai số được nhân với nhau, thông tin độc lập từ mỗi số riêng biệt sẽ biến mất.nΣtôi= =1n(Xtôi-X¯)(Ytôi-Y¯)n

Như một ví dụ điển hình, hãy xem xét rằng

24= =1*24= =2*12= =3*số 8= =4*6= =6*4= =số 8*3= =12*2= =24*1 ,

và điều đó không bao gồm các số vô tỷ và phân số, ví dụ , để khi chúng ta nhân hai chuỗi số với nhau và kiểm tra sản phẩm của chúng, tất cả những gì chúng ta thấy là từ một dãy số, vì chúng ta đã mất một nửa thông tin ban đầu, nghĩa là hai số đó là gì trước khi nhóm cặp khôn ngoan thành một số (nghĩa là nhân) được thực hiện. df=n-124= =26*26df= =n-1

Nói cách khác, không mất tính tổng quát, chúng ta có thể viết

zi ˉ z(Xtôi-X¯)(Ytôi-Y¯)= =ztôi-z¯ cho một số và ,ztôiz¯

tức là , và, . Từ các , sau đó rõ ràng có , công thức hiệp phương sai trở thànhˉ z = ˉ X ˉztôi= =XtôiYtôi-X¯Ytôi-XtôiY¯ zdf=n-1z¯= =X¯Y¯zdf= =n-1

Σtôi= =1nztôi-z¯n-1= =

Σtôi= =1n[(Xtôi-X¯)(Ytôi-Y¯)]n-1= =

1n-1Σtôi= =1n(Xtôi-X¯)(Ytôi-Y¯) .

Vì vậy, câu trả lời cho câu hỏi là được giảm một nửa bằng cách nhóm.df


@whuber Làm thế nào trên trái đất tôi nhận được điều tương tự được đăng hai lần và xóa một lần? Đưa cái gì? Chúng ta có thể thoát khỏi một trong số họ? Để tham khảo trong tương lai, có cách nào để xóa vĩnh viễn các bản sao đó không? Tôi có một vài treo xung quanh và nó gây phiền nhiễu.
Carl

Theo như tôi có thể nói, bạn đã đăng lại câu trả lời của bạn từ bản sao đến đây. (Không ai khác có quyền đăng câu trả lời trong tên của bạn.) Hệ thống không khuyến khích đăng câu trả lời giống hệt nhau trong nhiều luồng, vì vậy khi tôi thấy điều đó, tôi đã thuyết phục hai chủ đề này là bản sao hoàn hảo và tôi "hợp nhất" chúng. Đây là một thủ tục di chuyển tất cả các ý kiến ​​và câu trả lời từ luồng nguồn sang luồng đích. Sau đó tôi đã xóa bài viết trùng lặp của bạn ở đây trong chuỗi mục tiêu. Nó sẽ vẫn bị xóa vĩnh viễn, nhưng sẽ hiển thị cho bạn cũng như những người có uy tín đủ cao.
whuber

@whuber Tôi không biết điều gì xảy ra trong một sự hợp nhất, rằng một sự hợp nhất đang diễn ra hoặc nhiều quy tắc là gì, mặc dù việc tìm kiếm mọi thứ liên tục. Phải mất thời gian để học, hãy kiên nhẫn, BTW, bạn có cân nhắc việc lấy số liệu thống kê.stackexchange.com / questions / 251700 / ra khỏi Hold?
Carl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.