Mới đối với Python.
Trong R, bạn có thể lấy thứ nguyên của ma trận bằng cách sử dụng dim (...). Hàm tương ứng trong Python Pandas cho khung dữ liệu của chúng là gì?
Mới đối với Python.
Trong R, bạn có thể lấy thứ nguyên của ma trận bằng cách sử dụng dim (...). Hàm tương ứng trong Python Pandas cho khung dữ liệu của chúng là gì?
Câu trả lời:
Có một số cách để lấy thông tin về các thuộc tính của DataFrame hoặc Chuỗi của bạn.
Tạo DataFrame và Series mẫu
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape
Thuộc tínhCác shape
thuộc tính trả về một tuple hai mục tương ứng của số hàng và số cột trong DataFrame. Đối với một Sê-ri, nó trả về một bộ giá trị một mục.
df.shape
(3, 2)
s.shape
(3,)
len
chức năngĐể lấy số hàng của DataFrame hoặc lấy độ dài của Chuỗi, hãy sử dụng len
hàm. Một số nguyên sẽ được trả về.
len(df)
3
len(s)
3
size
thuộc tínhĐể nhận tổng số phần tử trong DataFrame hoặc Chuỗi, hãy sử dụng size
thuộc tính. Đối với DataFrames, đây là tích của số hàng và số cột. Đối với một Dòng, điều này sẽ tương đương với len
hàm:
df.size
6
s.size
3
ndim
thuộc tínhCác ndim
thuộc tính trả về số kích thước của DataFrame hay Series của bạn. Nó sẽ luôn là 2 cho DataFrames và 1 cho Series:
df.ndim
2
s.ndim
1
count
Phương pháp khóCác count
phương pháp có thể được sử dụng để trả lại số của các giá trị phi thiếu cho mỗi cột / hàng của DataFrame. Điều này có thể rất khó hiểu, bởi vì hầu hết mọi người thường nghĩ về số đếm chỉ là độ dài của mỗi hàng, nhưng không phải vậy. Khi được gọi trên DataFrame, một Chuỗi được trả về với tên cột trong chỉ mục và số lượng giá trị không bị thiếu làm giá trị.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Đối với một Chuỗi, chỉ có một trục để tính toán và do đó, nó chỉ trả về một đại lượng vô hướng:
s.count()
2
info
phương pháp để truy xuất siêu dữ liệuCác info
phương thức trả về số lượng các loại phi mất tích giá trị và dữ liệu của mỗi cột
df.info ()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes