Giả sử tôi có một khung dữ liệu với các quốc gia như sau:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Tôi biết rằng có một chức năng pd.get_dummies để chuyển đổi các quốc gia thành 'các mã hóa phổ biến'. Tuy nhiên, tôi muốn chuyển đổi chúng thành các chỉ số để thay vào đó tôi sẽ nhận được cc_index = [1,2,1,3]
.
Tôi giả định rằng có một cách nhanh hơn là sử dụng get_dummies cùng với mệnh đề numpy where như được hiển thị bên dưới:
[np.where(x) for x in df.cc.get_dummies().values]
Điều này có phần dễ thực hiện hơn trong R bằng cách sử dụng 'factor', vì vậy tôi hy vọng gấu trúc có thứ gì đó tương tự.
cc_index = [0,1,0,2]
?