Tôi làm việc trong năng lượng tái tạo. Công ty tôi tập hợp rất nhiều dữ liệu từ thiết bị. Điều này thường bao gồm dữ liệu quá trình (như nhiệt độ máy biến áp, điện áp đường dây, dòng điện, v.v.) và các báo động riêng biệt (ví dụ ngắt ngắt, giá trị cảnh báo biến tần, báo động biến áp qua nhiệt độ). Đây là một ví dụ sơ bộ về dữ liệu của chúng tôi trông như thế nào (được đọc là các dòng của csv):
- dấu thời gian, thẻ, giá trị
- 25/05/2016 14:30:01, INVERTER_1.VOLTAGE_DC, 249.5
- 25/05/2016 14:30:06, INVERTER_1.VOLTAGE_DC, 250.1
- 25/05/2016 14:45:02, TRANSFORMER_1.TEMP_ALARM, 0
- 25/05/2016 14:45:15, TRANSFORMER_1.TEMP_ALARM, 1
Tôi muốn bắt đầu thực hiện một số phân tích mẫu trên dữ liệu này khi nghỉ ngơi, không phải thời gian thực (ít nhất là bây giờ). Tôi tin rằng những gì tôi muốn thử là học tính năng không giám sát, nhưng tôi không hoàn toàn chắc chắn. Sẽ rất tốt (tôi nghĩ) khi áp dụng học máy vào 1) xác định bất kỳ mẫu nào không rõ ràng và 2) cho phép thuật toán xác định chữ ký của các mẫu trong dữ liệu (ví dụ: tất cả các bộ biến tần trên một bộ nạp đơn đều mất liên lạc khi bộ ngắt đang mở).
Câu hỏi ban đầu của tôi: Đây có được coi là dữ liệu chuỗi thời gian không? Trong nghiên cứu của tôi cho đến nay, dường như dữ liệu chuỗi thời gian đang tham chiếu dữ liệu là một chức năng của thời gian. Đối với hầu hết dữ liệu của tôi, với tư cách là một chuyên gia về miền, tôi không tin rằng việc xác định các hàm cho dữ liệu của mình là hữu ích cho phân tích này. Ngoài ra, trong nghiên cứu của tôi, dường như dữ liệu chuỗi thời gian đề cập đến các giá trị thực và không rời rạc.
Bất kỳ ý kiến hoặc tài liệu tham khảo có liên quan sẽ hữu ích.