Trong một vấn đề tôi đang làm việc, tôi có hai biến ngẫu nhiên là X và Y. Tôi cần tìm hiểu mức độ tương quan chặt chẽ của hai trong số chúng, nhưng chúng có kích thước khác nhau. Thứ hạng của không gian hàng của X là 4350 và thứ hạng của không gian hàng của Y lớn hơn đáng kể, trong hàng chục nghìn. Cả X và Y có cùng số cột.
Tôi cần một thước đo tương quan giữa hai biến và r Pearson yêu cầu X và Y có kích thước bằng nhau (ít nhất R yêu cầu hai rv là).
Tôi có hy vọng làm được mối tương quan giữa hai điều này không, hay tôi nên tìm cách cắt tỉa những quan sát từ Y?
EDIT
Thêm thông tin từ các ý kiến, cần có trong câu hỏi.
Tôi cho rằng tôi đã quên đề cập đến điều này. X và Y là giá cổ phiếu. Công ty X đã được công khai trong khoảng thời gian ngắn hơn nhiều so với Y. Tôi muốn cho biết giá của X và Y tương quan như thế nào. Tôi chắc chắn có thể có được một mối tương quan trong khoảng thời gian mà cả X và Y đều tồn tại. Tôi muốn biết nếu biết giá cổ phiếu trong vài năm nữa của Y mà X không tồn tại mang lại cho tôi bất kỳ thông tin bổ sung nào.