Câu hỏi được gắn thẻ «dataframe»

Khung dữ liệu là cấu trúc dữ liệu dạng bảng. Thông thường, nó chứa dữ liệu trong đó các hàng là các quan sát và các cột là các biến có nhiều loại khác nhau. Trong khi "khung dữ liệu" hoặc "khung dữ liệu" là thuật ngữ được sử dụng cho khái niệm này trong một số ngôn ngữ (R, Apache Spark, deedle, Maple, thư viện gấu trúc trong Python và thư viện DataFrames ở Julia), "bảng" là thuật ngữ được sử dụng trong MATLAB và SQL.



8
Xóa các giá trị `Inf` khỏi khung dữ liệu R
Trong R, tôi có một phép toán tạo ra một số Infgiá trị khi tôi chuyển đổi khung dữ liệu. Tôi muốn biến những Infgiá trị này thành NAgiá trị. Mã tôi có chậm đối với dữ liệu lớn, có cách nào nhanh hơn để làm điều này không? Giả …
101 r  dataframe  data.table 


7
Cách chuyển một cột trong Pandas DataFrame
Tôi muốn chuyển một cột trong một con gấu trúc DataFrame, nhưng tôi không thể tìm thấy phương pháp để thực hiện điều đó từ tài liệu mà không cần viết lại toàn bộ DF. Có ai biết làm thế nào để làm điều đó? Khung dữ liệu: ## x1 …
100 python  pandas  dataframe 


10
Lọc cột khung dữ liệu Pyspark không có giá trị nào
Tôi đang cố gắng lọc khung dữ liệu PySpark có Nonegiá trị hàng: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] và tôi có thể lọc chính xác với một giá trị chuỗi: df[df.dt_mvmt == '2016-03-31'] # some results here nhưng điều này không thành công: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt …


2
Cột thùng rác có gấu trúc trăn
Tôi có cột Khung dữ liệu với các giá trị số: df['percentage'].head() 46.5 44.2 100.0 42.12 Tôi muốn xem cột là số lượng bin: bins = [0, 1, 5, 10, 25, 50, 100] Làm thế nào tôi có thể nhận được kết quả là thùng với của họ value counts? …

5
cách thay đổi cột Dataframe từ kiểu String thành Double type trong pyspark
Tôi có một khung dữ liệu với cột là Chuỗi. Tôi muốn thay đổi loại cột thành Loại kép trong PySpark. Sau đây là cách, tôi đã làm: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Tôi chỉ muốn biết, đây có phải là cách đúng đắn để làm điều …






Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.