Tương quan là hiệp phương sai chuẩn hóa , tức là hiệp phương sai của x và y chia cho độ lệch chuẩn của x và y . Hãy để tôi minh họa điều đó.
Nói một cách lỏng lẻo, số liệu thống kê có thể được tóm tắt là mô hình phù hợp với dữ liệu và đánh giá mô hình mô tả các điểm dữ liệu đó tốt như thế nào ( Kết quả = Mô hình + Lỗi ). Một cách để làm điều đó là tính tổng các sai lệch hoặc phần dư (res) từ mô hình:
res=∑(xi−x¯)
Nhiều tính toán thống kê được dựa trên điều này, bao gồm. hệ số tương quan (xem bên dưới).
Dưới đây là một tập dữ liệu mẫu được thực hiện R
(phần dư được chỉ định là các dòng màu đỏ và giá trị của chúng được thêm bên cạnh chúng):
X <- c(8,9,10,13,15)
Y <- c(5,4,4,6,8)
Bằng cách xem xét từng điểm dữ liệu riêng lẻ và trừ đi giá trị của nó khỏi mô hình (ví dụ: giá trị trung bình; trong trường hợp này X=11
và Y=5.4
), người ta có thể đánh giá độ chính xác của mô hình. Người ta có thể nói mô hình quá / đánh giá thấp giá trị thực tế. Tuy nhiên, khi tổng hợp tất cả các sai lệch so với mô hình, tổng sai số có xu hướng bằng 0 , các giá trị triệt tiêu lẫn nhau vì có các giá trị dương (mô hình đánh giá thấp một điểm dữ liệu cụ thể) và các giá trị âm (mô hình đánh giá quá cao một dữ liệu cụ thể điểm). Để giải quyết vấn đề này, các tổng của sai lệch được bình phương và bây giờ được gọi là tổng của bình phương ( SS ):
SS=∑(xi−x¯)(xi−x¯)=∑(xi−x¯)2
n−1s2
s2=SSn−1=∑(xi−x¯)(xi−x¯)n−1=∑(xi−x¯)2n−1
Để thuận tiện, căn bậc hai của phương sai mẫu có thể được lấy, được gọi là độ lệch chuẩn mẫu:
s=s2−−√=SSn−1−−−√=∑(xi−x¯)2n−1−−−−−−−√
Bây giờ, hiệp phương sai đánh giá xem hai biến có liên quan với nhau không. Một giá trị dương chỉ ra rằng khi một biến lệch khỏi giá trị trung bình, biến còn lại lệch theo cùng một hướng.
covx,y=∑(xi−x¯)(yi−y¯)n−1
r
r=covx,ysxsy=∑(x1−x¯)(yi−y¯)(n−1)sxsy
In this, case the Pearson correlation coefficient is r=0.87, có thể được coi là một mối tương quan mạnh mẽ (mặc dù điều này cũng tương đối tùy thuộc vào lĩnh vực nghiên cứu). Để kiểm tra điều này, ở đây một âm mưu khác với X
trên trục x và Y
trên trục y:
Câu chuyện dài quá, vâng, cảm giác của bạn là đúng nhưng tôi hy vọng câu trả lời của tôi có thể cung cấp một số bối cảnh.