Có công cụ dọn dẹp dữ liệu nào cho python / pandas tương tự như công cụ R tidyr không?


18

Tôi đang thực hiện một thử thách Kaggle trong đó một số biến được biểu thị bằng các hàng thay vì các cột (Sự gián đoạn mạng Telstra). Tôi hiện đang tìm kiếm tương đương của tập hợp (), riêng biệt () và lây lan (), có thể được tìm thấy trong công cụ R tidyr.


Câu trả lời:



3

R về gather()cơ bản đi từ rộng đến dài. Vì thế,

  1. rà soát gấu trúc trang về cách sử dụng pandas.wide_to_long(),
  2. kiểm tra blog này để thảo luận về việc có được một gatherchức năng giống như thanh lịch trong Python.

0

Tôi đã cố gắng bắt chước cú pháp gói tidyr trong python trong một gói gọi là tidypython. Tôi đã làm cho nó tương thích với gói dplython, bao gồm việc sử dụng toán tử >> cho các chuỗi chuỗi.

Nó chưa được thử nghiệm đầy đủ, nhưng sẽ hoạt động khá tốt:

https://github.com/durrantmm/tidypython

Hãy cho tôi biết nếu nó làm việc cho bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.