Tôi có khung dữ liệu gấu trúc sau Top15
:
Tôi tạo một cột ước tính số lượng tài liệu phù hợp cho mỗi người:
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
Tôi muốn biết mối tương quan giữa số lượng tài liệu phù hợp trên đầu người và mức cung cấp năng lượng trên đầu người. Vì vậy, tôi sử dụng .corr()
phương pháp (tương quan của Pearson):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
Tôi muốn trả về một số duy nhất, nhưng kết quả là:
.corr
trực tiếp vào khung dữ liệu của mình, nó sẽ trả về tất cả các tương quan theo cặp; đó là lý do tại sao bạn quan sát 1s ở đường chéo của ma trận của bạn (mỗi cột có tương quan hoàn hảo với chính nó). Xem chỉnh sửa của tôi bên dưới.