Tôi có một khung dữ liệu gấu trúc với một vài mục và tôi muốn tính toán mối tương quan giữa thu nhập của một số loại cửa hàng. Có một số cửa hàng có dữ liệu thu nhập, phân loại khu vực hoạt động (nhà hát, cửa hàng vải, thực phẩm ...) và các dữ liệu khác.
Tôi đã cố gắng tạo khung dữ liệu mới và chèn một cột có thu nhập của tất cả các loại cửa hàng thuộc cùng loại và khung dữ liệu trả về chỉ có cột đầu tiên được lấp đầy và phần còn lại chứa đầy NaN. Mã mà tôi mệt mỏi:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Tôi muốn làm như vậy, vì vậy tôi có thể sử dụng .corr()
để đưa ra ma trận tương quan giữa danh mục cửa hàng.
Sau đó, tôi muốn biết làm thế nào tôi có thể vẽ các giá trị ma trận (-1 đến 1, vì tôi muốn sử dụng tương quan của Pearson) với matplolib.