Nếu hai đặc điểm có mối tương quan đã biết, bạn có thể dự đoán xác suất chúng sẽ sắp xếp phù hợp cho một cặp ngẫu nhiên không?
Nó phụ thuộc vào mối tương quan dân số mà bạn nhìn vào.
Đối với mối tương quan Pearson mà bạn đề cập (ρ), câu trả lời là "không", ít nhất là không có các giả định bổ sung. (Câu trả lời của RobertF là chính xác)
Nếu thay vào đó, bạn biết mối tương quan Kendall dân số ( Kendall's tau , ở đây được ký hiệu làτK) trong một phân phối bivariate liên tục thì câu trả lời thực sự là có.
Mối tương quan Kendall dân số là sự khác biệt giữa xác suất của một cặp tương ứng và xác suất của một cặp bất hòa:
τK=pC−pD
(mối tương quan mẫu Kendall tương tự như sự khác biệt về tỷ lệ mẫu của các cặp tương ứng và bất hòa).
Kể từ khi trong quần thể bivariate liên tục pC+pD=1, nếu bạn biết τK bạn có thể tính toán pC:
τK=pC−pD
=pC−(1−pC)
=2pC−1
Vì thế pC=12(τK+1), một kết quả đơn giản tốt đẹp.
Trong khi τK xác định xác suất bạn yêu cầu (ít nhất là trong trường hợp liên tục), mối quan hệ giữa ρ và τKphụ thuộc vào cấu trúc của mối quan hệ bivariate giữa các biến (tức là copula ).
Nếu bạn giả sử tính quy tắc bivariate, thì bạn có thể tìm ra kết nối (phi tuyến) giữa τK và ρ. Trong thực tế đây là một kết quả nổi tiếng; chúng ta có:
τK=2πarcsin(ρ)
- xem giây 5.3.2 của Embrechts et al. (2005) [1], kết quả này cũng có thể được tìm thấy ở nhiều nơi - ví dụ như trong Meyer (2009) [2]. Vì vậy, trong trường hợp đó
pC=arcsin(ρ)π+12.
(Tuy nhiên, một giả định về tính quy tắc bivariate có vẻ không rõ ràng đối với BMI và huyết áp)
Mối quan hệ giữa τK và ρthực sự giữ cho phân phối elip nói chung hơn. Xem ví dụ Lindskog, McNeil, & Schmock (2003) [3]. Tuy nhiên, một lần nữa, giả định này đối với BMI và huyết áp có thể không rõ ràng - ví dụ, cả hai biện pháp trong thực tế đều có xu hướng sai lệch.
[1] Embrechts, P., Frey, R., McNeil, AJ (2005),
Quản lý rủi ro định lượng: Khái niệm, Kỹ thuật, Công cụ ,
sê-ri Princeton trong Tài chính, Nhà xuất bản Đại học Princeton
[2] Meyer, C. (2009),
Copula Bivariate bình thường ,
arXiv: 0912.2816v1 [math.PR] pdf (15 tháng 12)
[3] Lindskog, F., McNeil, AJ, Schmock, U., (2003),
"Kendall's tau cho phân phối elip"
trong: Rủi ro tín dụng; Đo lường, Đánh giá và Quản lý , ed. G. Bol và cộng sự,
Đóng góp cho Kinh tế học, Physica-Verlag Heidelberg, tr.149.
(hoặc xem http://www.macs.hw.ac.uk/~mcneil/ftp/KendallsTau.pdf )