Tính trung bình các giá trị tương quan


20

Giả sử tôi kiểm tra cách biến Yphụ thuộc vào biến Xtrong các điều kiện thí nghiệm khác nhau và thu được biểu đồ sau:

nhập mô tả hình ảnh ở đây

Các đường gạch ngang trong biểu đồ trên biểu thị hồi quy tuyến tính cho từng chuỗi dữ liệu (thiết lập thử nghiệm) và các số trong chú giải biểu thị mối tương quan Pearson của từng chuỗi dữ liệu.

Tôi muốn tính toán "tương quan trung bình" (hoặc "tương quan trung bình") giữa XY. Tôi có thể chỉ đơn giản là trung bình các rgiá trị? Còn "tiêu chí xác định trung bình", thì sao? Tôi có nên tính trung bình và hơn lấy bình phương của giá trị đó hay tôi nên tính trung bình của các cá nhân R 2 ?R2rR2

Câu trả lời:


15

Cách đơn giản là thêm một biến phân loại để xác định các điều kiện thử nghiệm khác nhau và đưa nó vào mô hình của bạn cùng với "tương tác" với x ; đó là, y z + x # z . Điều này tiến hành tất cả năm hồi quy cùng một lúc. R 2 của nó là những gì bạn muốn.zxyz+x#zR2

Để xem tại sao trung bình các giá trị riêng lẻ có thể sai, giả sử hướng của độ dốc bị đảo ngược trong một số điều kiện thí nghiệm. Bạn sẽ tính trung bình một bó 1 và -1 đến khoảng 0, điều này sẽ không phản ánh chất lượng của bất kỳ sự phù hợp nào. Để xem tại sao trung bình R 2 (hoặc bất kỳ phép biến đổi cố định nào) không đúng, giả sử rằng trong hầu hết các điều kiện thí nghiệm, bạn chỉ có hai quan sát, sao cho R 2 của chúng đều bằng 1 , nhưng trong một thử nghiệm bạn có hàng trăm quan sát với R 2 = 0 . R 2 trung bình gần 1 sẽ không phản ánh đúng tình huống.RR2R21R2=0R2


1
tha thứ cho sự thiếu hiểu biết của tôi, nhưng dấu # trong câu trả lời của bạn có ý nghĩa gì?
Boris Gorelik

1
Tôi nghĩ rằng câu trả lời của bạn là một câu hỏi rất hay cho định nghĩa tương quan hàm ý được sử dụng. Điều gì sẽ xảy ra nếu chúng có nghĩa là độ dốc chuẩn hóa (có lẽ được ngụ ý bởi hình vẽ)? Trong trường hợp đó, bạn muốn tiêu cực và tích cực để hủy bỏ. Bạn đã chết về vấn đề kích thước mẫu. Ngoài ra, hãy xem xét chuyển bình luận của bạn vào câu trả lời của bạn.
Giăng

Bạn có muốn hoặc R 2 điều chỉnh ? R2R2
russellpierce 23/07/13

±1R21

R2R21

24

Đối với các hệ số tương quan Pearson, nói chung là thích hợp để chuyển đổi các giá trị r bằng cách sử dụng phép biến đổi Fisher z . Sau đó, trung bình các giá trị z và chuyển đổi trung bình trở lại giá trị r .

Tôi tưởng tượng nó cũng sẽ tốt cho một hệ số Spearman.

Đây là một bài báomục wikipedia .


1
+1; Câu trả lời này có vẻ phù hợp và chung chung hơn câu trả lời được chấp nhận, tuy nhiên trong trường hợp sử dụng cụ thể, liệu nó có bị rớt cho các giá trị r không? Có một cái gì đó giống như một logit emperical hợp lý ở đây, nơi người ta sẽ chỉ "thêm" một datapoint thiếu sự tương quan? Nếu vậy, người ta sẽ thêm nó vào đâu? Người ta sẽ phải tiến hành một sim monte carlo lấy hai biến ngẫu nhiên từ các bản phân phối nguồn? Hoặc người ta chỉ cần điều chỉnh r đến một số giá trị nhỏ hơn 1? Nên điều chỉnh bao xa?
russellpierce

3

Các mối tương quan trung bình có thể có nghĩa. Cũng xem xét việc phân phối các mối tương quan (ví dụ, vẽ biểu đồ).

n

m


1

Điều gì về việc sử dụng bình phương dự đoán bình phương (MSPE) cho hiệu suất của thuật toán? Đây là một cách tiếp cận tiêu chuẩn cho những gì bạn đang cố gắng thực hiện, nếu bạn đang cố gắng so sánh hiệu suất dự đoán giữa một bộ các thuật toán.


Tôi không chắc tại sao bài đăng này stats.stackexchange.com/questions/17129/ săn được hợp nhất với bài này. Họ thực sự đang hỏi hai câu hỏi khác nhau trong ý kiến ​​của tôi - có hai mục tiêu khác nhau.
StatsStudent

1
Bạn đúng: chúng là những câu hỏi khác nhau. Tôi đã bỏ phiếu để mở lại bài đăng khác (mặc dù hiệu ứng có thể không rõ ràng). Tôi xin lỗi vì đã không thấy bình luận của bạn: nếu bạn đã gắn cờ bài đăng đó thì nó sẽ được chúng tôi chú ý sớm hơn vài năm!
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.