Python - Kích thước của khung dữ liệu


81

Mới đối với Python.

Trong R, bạn có thể lấy thứ nguyên của ma trận bằng cách sử dụng dim (...). Hàm tương ứng trong Python Pandas cho khung dữ liệu của chúng là gì?


2
Để có bản tóm tắt chi tiết về tất cả các cách nhận thông tin về thứ nguyên trên DataFrames và Series, hãy xem câu trả lời này bên dưới
Ted Petrou

Câu trả lời:



23

Tóm tắt tất cả các cách để nhận thông tin về các thứ nguyên của DataFrame hoặc Series

Có một số cách để lấy thông tin về các thuộc tính của DataFrame hoặc Chuỗi của bạn.

Tạo DataFrame và Series mẫu

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape Thuộc tính

Các shapethuộc tính trả về một tuple hai mục tương ứng của số hàng và số cột trong DataFrame. Đối với một Sê-ri, nó trả về một bộ giá trị một mục.

df.shape
(3, 2)

s.shape
(3,)

len chức năng

Để lấy số hàng của DataFrame hoặc lấy độ dài của Chuỗi, hãy sử dụng lenhàm. Một số nguyên sẽ được trả về.

len(df)
3

len(s)
3

size thuộc tính

Để nhận tổng số phần tử trong DataFrame hoặc Chuỗi, hãy sử dụng sizethuộc tính. Đối với DataFrames, đây là tích của số hàng và số cột. Đối với một Dòng, điều này sẽ tương đương với lenhàm:

df.size
6

s.size
3

ndim thuộc tính

Các ndimthuộc tính trả về số kích thước của DataFrame hay Series của bạn. Nó sẽ luôn là 2 cho DataFrames và 1 cho Series:

df.ndim
2

s.ndim
1

countPhương pháp khó

Các countphương pháp có thể được sử dụng để trả lại số của các giá trị phi thiếu cho mỗi cột / hàng của DataFrame. Điều này có thể rất khó hiểu, bởi vì hầu hết mọi người thường nghĩ về số đếm chỉ là độ dài của mỗi hàng, nhưng không phải vậy. Khi được gọi trên DataFrame, một Chuỗi được trả về với tên cột trong chỉ mục và số lượng giá trị không bị thiếu làm giá trị.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

Đối với một Chuỗi, chỉ có một trục để tính toán và do đó, nó chỉ trả về một đại lượng vô hướng:

s.count()
2

Sử dụng infophương pháp để truy xuất siêu dữ liệu

Các infophương thức trả về số lượng các loại phi mất tích giá trị và dữ liệu của mỗi cột

df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.