Có nghĩa là trung tâm làm giảm hiệp phương sai?


11

Giả sử tôi có hai biến ngẫu nhiên không độc lập và tôi muốn giảm hiệp phương sai giữa chúng càng nhiều càng tốt mà không mất quá nhiều "tín hiệu", có nghĩa là giúp định tâm? Tôi đã đọc ở đâu đó có nghĩa là định tâm làm giảm sự tương quan bởi một yếu tố quan trọng, vì vậy tôi nghĩ rằng nó nên làm như vậy cho hiệp phương sai.

Câu trả lời:


30

Nếu XY là các biến ngẫu nhiên và mộtb là hằng số, thì

Cov(X+một,Y+b)= =E[(X+một-E[X+một])(Y+b-E[Y+b])]= =E[(X+một-E[X]-E[một])(Y+b-E[Y]-E[b])]= =E[(X+một-E[X]-một)(Y+b-E[Y]-b)]= =E[(X-E[X])(Y-E[Y])]= =Cov(X,Y).
Định tâm là trường hợp đặc biệtmột= =-E[X]b= =-E[Y], do đó, định tâm không ảnh hưởng đến hiệp phương sai.


Ngoài ra, vì tương quan được định nghĩa là

Đúng(X,Y)= =Cov(X,Y)Var(X)Var(Y),
chúng ta có thể thấy
Đúng(X+một,Y+b)= =Cov(X+một,Y+b)Var(X+một)Var(Y+b)= =Cov(X,Y)Var(X)Var(Y),
do đó, đặc biệt, mối tương quan không bị ảnh hưởng bởi việc định tâm.


Đó là phiên bản dân số của câu chuyện. Phiên bản mẫu giống nhau: Nếu chúng ta sử dụng

Cov^(X,Y)= =1nΣTôi= =1n(XTôi-1nΣj= =1nXj)(YTôi-1nΣj= =1nYj)
theo ước tính hiệp phương sai giữaXYtừ một mẫu được ghép(X1,Y1),Giáo dục,(Xn,Yn), sau đó
Cov^(X+một,Y+b)= =1nΣTôi= =1n(XTôi+một-1nΣj= =1n(Xj+một))(YTôi+b-1nΣj= =1n(Yj+b))= =1nΣTôi= =1n(XTôi+một-1nΣj= =1nXj-nnmột)(YTôi+b-1nΣj= =1nYj-nnb)= =1nΣTôi= =1n(XTôi-1nΣj= =1nXj)(YTôi-1nΣj= =1nYj)= =Cov^(X,Y)
cho bất kỳmộtb.


Cảm ơn các câu trả lời chi tiết. Điều đó có nghĩa là đối với hiệp phương sai mẫu, cỡ mẫu cũng không có bất kỳ tác động nào? tức là giảm cỡ mẫu không làm giảm hiệp phương sai mẫu?
lvdp

3
@lvdp Đó có lẽ là một câu hỏi riêng biệt.
Tích lũy

Một cỡ mẫu giảm chỉ có thể đi kèm với một mẫu khác. Do đó, một mẫu khác nhau có thể cho thấy hiệp phương sai khác nhau. Nhưng vì hiệp phương sai mẫu được định nghĩa là trung bình, kích thước mẫu được chia tỷ lệ theo nguyên tắc.
Nick Cox

5

Định nghĩa hiệp phương sai của XYE[(X-E[X])(Y-E[Y])]X-E[X]XXkhi chúng ta lấy hiệp phương sai, và định tâm là một toán tử idempotent; một khi một biến được định tâm, áp dụng quy trình định tâm thêm lần nữa sẽ không thay đổi nó. Nếu công thức không lấy các phiên bản trung tâm của các biến, thì sẽ có tất cả các loại hiệu ứng kỳ lạ, chẳng hạn như hiệp phương sai giữa nhiệt độ và một biến khác khác nhau tùy thuộc vào việc chúng ta đo nhiệt độ bằng Celsius hay Kelvin.


3

"ở đâu đó" có xu hướng là một nguồn khá không đáng tin cậy ...

Hiệp phương sai / tương quan được xác định với định tâm rõ ràng . Nếu bạn không tập trung vào dữ liệu, thì bạn không tính toán hiệp phương sai / tương quan. (Chính xác: Tương quan Pearson)

Sự khác biệt chính là liệu bạn tập trung vào một mô hình lý thuyết (ví dụ: giá trị mong đợi được cho là chính xác 0) hoặc dựa trên dữ liệu (trung bình số học). Dễ dàng thấy rằng trung bình số học sẽ mang lại Hiệp phương sai nhỏ hơn bất kỳ trung tâm khác nhau.

Tuy nhiên, hiệp phương sai nhỏ hơn không ngụ ý tương quan nhỏ hơn, hoặc ngược lại. Giả sử rằng chúng ta có dữ liệu X = (1,2) và Y = (2,1). Dễ dàng thấy rằng với việc định tâm trung bình số học, điều này sẽ mang lại mối tương quan hoàn toàn âm, trong khi nếu chúng ta biết quá trình tạo ra trung bình 0, thì dữ liệu thực sự có mối tương quan tích cực. Vì vậy, trong ví dụ này, chúng tôi đang định tâm - nhưng với giá trị lý thuyết dự kiến ​​là 0.

Điều này có thể phát sinh dễ dàng. Hãy xem xét chúng ta có một mảng cảm biến, 11x11, với các ô được đánh số từ -5 đến +5. Thay vì lấy trung bình số học, sẽ tốt hơn nếu sử dụng giá trị trung bình "vật lý" của mảng cảm biến của chúng tôi ở đây khi tìm mối tương quan của các sự kiện cảm biến (nếu chúng tôi liệt kê các ô từ 0 đến 10, chúng tôi sẽ sử dụng 5 là trung bình cố định, và chúng tôi sẽ nhận được kết quả chính xác như nhau, để lựa chọn lập chỉ mục biến mất khỏi phân tích - tốt đẹp).


Cảm ơn @ Anony-Mousse, hiệp phương sai mẫu có phụ thuộc vào cỡ mẫu không? Tức là cỡ mẫu nhỏ hơn sẽ mang lại hiệp phương sai nhỏ hơn (trước khi định tâm).
lvdp

1
Phụ thuộc vào mẫu rõ ràng. Trung bình - tôi không biết. Tôi hy vọng các mẫu nhỏ hơn sẽ có nhiều biến động hơn, vì vậy có thể thường có giá trị cực đoan hơn. Nhưng đó chỉ là một trực giác.
Có QUIT - Anony-Mousse
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.