Để lọc khung dữ liệu (df) theo một cột, nếu chúng tôi xem xét dữ liệu với nam và nữ, chúng ta có thể:
males = df[df[Gender]=='Male']
Câu hỏi 1 - Nhưng điều gì sẽ xảy ra nếu dữ liệu kéo dài nhiều năm và tôi muốn chỉ nhìn thấy nam giới trong năm 2014?
Trong các ngôn ngữ khác, tôi có thể làm điều gì đó như:
if A = "Male" and if B = "2014" then
(ngoại trừ tôi muốn làm điều này và lấy một tập hợp con của khung dữ liệu ban đầu trong một đối tượng khung dữ liệu mới)
Câu hỏi 2. Làm cách nào để thực hiện việc này trong vòng lặp và tạo đối tượng khung dữ liệu cho từng nhóm năm và giới tính duy nhất (ví dụ: df cho: 2013-Male, 2013-Female, 2014-Male và 2014-Female
for y in year:
for g in gender:
df = .....
groupby
.