Tôi đang tìm kiếm một công cụ hoặc quy trình để giúp tự động hóa các tác vụ dòng công việc lặp đi lặp lại yêu cầu với tệp Excel hoặc CSV ở định dạng cụ thể.
Ví dụ: chúng tôi làm việc với các nhà cung cấp gửi cho chúng tôi danh sách khách hàng. Dữ liệu trong bảng tính chúng tôi nhận được là như nhau, nhưng nó có thể được định hình hơi khác nhau. Ví dụ: chúng tôi có thể nhận được một tệp có các cột này:
[ID][FName][LName][Birthday]
Tuy nhiên, giả sử hệ thống của chúng tôi cần nó có hình dạng như vậy:
[ID][FirstName][LastName][Birthdate]
Ngoài ra, dữ liệu có thể ở định dạng hơi khác so với hệ thống của chúng tôi. Ví dụ: giả sử cột ngày sinh cần phải ở một định dạng cụ thể (MM / DD / YYYY) trong đó nhà cung cấp có thể cung cấp nó dưới dạng (YYYY-MM-DD).
Giả sử tệp chúng tôi nhận được từ nhà cung cấp luôn được gửi ở cùng định dạng, chúng tôi muốn chuyển đổi nhanh các tệp này để tương thích với hệ thống của chúng tôi.
Trong suy nghĩ của tôi, đây lý tưởng sẽ là một ứng dụng có các tính năng sau:
- Khả năng làm việc với các tệp Excel hoặc CSV
- Xác định cách đổi tên cột
- Xác định định dạng dữ liệu cho mỗi cột
- Dọn dẹp dữ liệu xấu (đôi khi khách hàng có chuỗi # N / A trong một trường, nên được coi là trống trong hệ thống của chúng tôi)
- Đầu ra dưới dạng CSV
- Hợp nhất các hàng bằng các cột khớp (đôi khi chúng tôi được cung cấp nhiều tệp cần được hợp nhất với nhau bằng ID)
- Giao diện GUI sẽ rất tốt để xác định các quy tắc, sau đó chạy nó bằng CLI có thể sẽ hữu ích cho việc tự động hóa / chạy trong tương lai
- Khả năng lưu các cài đặt này để chúng tôi có thể nhanh chóng chạy lại chúng trong tương lai bằng cách tải dữ liệu mới với các cài đặt được xác định trước đó.
Có một công cụ hoặc quy trình làm việc sẽ thực hiện điều này với rất ít ma sát? Chúng ta có thể phát triển một cái gì đó bên trong nếu cần thiết, nhưng nếu đã có một công cụ ngoài đó giúp việc này trở nên dễ dàng, đó sẽ là lý tưởng.