Tôi đang làm việc với dữ liệu chuỗi là danh sách dài các cuộc gọi win-api phần mềm độc hại. Tôi đang cố gắng đưa vấn đề xác định 'hành vi phần mềm độc hại' vào một trong việc tìm kiếm các mẫu liên tiếp. Tôi coi mỗi cuộc gọi api là một mục Itemet. Số lượng các mặt hàng khác nhau có thể (cuộc gọi api) là khá lớn.
Bây giờ, khi tôi áp dụng thuật toán SPADE (xem thêm, Zaki, SPADE: Thuật toán hiệu quả để khai thác các chuỗi thường xuyên , Học máy, 42, 31 Lỗi60, 2001) Tôi gặp vấn đề về bộ nhớ. Có cách nào khác tốt hơn để tìm các mẫu liên tiếp trong số các chuỗi từ vựng lớn lớn không?