Tôi tải một số dữ liệu học máy từ tệp CSV. 2 cột đầu tiên là các quan sát và các cột còn lại là các tính năng.
Hiện tại, tôi làm như sau:
data = pandas.read_csv('mydata.csv')
cung cấp một cái gì đó như:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
Tôi muốn cắt dataframe này trong hai dataframes: một chứa các cột a
và b
và một chứa các cột c
, d
và e
.
Không thể viết một cái gì đó như
observations = data[:'c']
features = data['c':]
Tôi không chắc phương pháp tốt nhất là gì. Tôi có cần pd.Panel
không?
Nhân tiện, tôi thấy việc lập chỉ mục khung dữ liệu khá không nhất quán: data['a']
được phép, nhưng data[0]
không được. Mặt khác, data['a':]
không được phép nhưng data[0:]
là. Có một lý do thực tế cho việc này? Điều này thực sự khó hiểu nếu các cột được lập chỉ mục bởi Int, cho rằngdata[0] != data[0:1]
df[5:10]
đã được thêm vào để chọn hàng ( pandas.pydata.org/pandas-docs/ sóng / trộm )