Mới đối với Python.
Trong R, bạn có thể lấy thứ nguyên của ma trận bằng cách sử dụng dim (...). Hàm tương ứng trong Python Pandas cho khung dữ liệu của chúng là gì?
Mới đối với Python.
Trong R, bạn có thể lấy thứ nguyên của ma trận bằng cách sử dụng dim (...). Hàm tương ứng trong Python Pandas cho khung dữ liệu của chúng là gì?
Câu trả lời:
Có một số cách để lấy thông tin về các thuộc tính của DataFrame hoặc Chuỗi của bạn.
Tạo DataFrame và Series mẫu
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape Thuộc tínhCác shapethuộc tính trả về một tuple hai mục tương ứng của số hàng và số cột trong DataFrame. Đối với một Sê-ri, nó trả về một bộ giá trị một mục.
df.shape
(3, 2)
s.shape
(3,)
len chức năngĐể lấy số hàng của DataFrame hoặc lấy độ dài của Chuỗi, hãy sử dụng lenhàm. Một số nguyên sẽ được trả về.
len(df)
3
len(s)
3
size thuộc tínhĐể nhận tổng số phần tử trong DataFrame hoặc Chuỗi, hãy sử dụng sizethuộc tính. Đối với DataFrames, đây là tích của số hàng và số cột. Đối với một Dòng, điều này sẽ tương đương với lenhàm:
df.size
6
s.size
3
ndim thuộc tínhCác ndimthuộc tính trả về số kích thước của DataFrame hay Series của bạn. Nó sẽ luôn là 2 cho DataFrames và 1 cho Series:
df.ndim
2
s.ndim
1
countPhương pháp khóCác countphương pháp có thể được sử dụng để trả lại số của các giá trị phi thiếu cho mỗi cột / hàng của DataFrame. Điều này có thể rất khó hiểu, bởi vì hầu hết mọi người thường nghĩ về số đếm chỉ là độ dài của mỗi hàng, nhưng không phải vậy. Khi được gọi trên DataFrame, một Chuỗi được trả về với tên cột trong chỉ mục và số lượng giá trị không bị thiếu làm giá trị.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Đối với một Chuỗi, chỉ có một trục để tính toán và do đó, nó chỉ trả về một đại lượng vô hướng:
s.count()
2
infophương pháp để truy xuất siêu dữ liệuCác infophương thức trả về số lượng các loại phi mất tích giá trị và dữ liệu của mỗi cột
df.info ()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes