Good tốt thường xuyên khai thác các gói khai thác trong Python?


12

Có ai đã sử dụng (và thích) bất kỳ gói "khai thác trình tự thường xuyên" tốt nào trong Python ngoài FPM trong MLLib chưa? Tôi đang tìm kiếm một gói ổn định, tốt nhất vẫn được duy trì bởi mọi người. Cảm ơn bạn!

Câu trả lời:


6

Người duy nhất tôi tìm thấy là: https://github.com/bartdag/pymining

họ có một triển khai BIDEở đó nhưng nó không được duy trì mã.

PS Tôi đang tham gia câu hỏi của bạn: - |


Chỉ cần làm rõ, nó đã không thực hiện BIDE mà khai thác các chuỗi khép kín thường xuyên. Nó thực sự đã triển khai PrefixSpan, khai thác tất cả các chuỗi thường xuyên. PrefixSpan và BIDE chia sẻ cùng một khung liệt kê mô hình và đó là lý do tại sao các tác giả đã trích dẫn bài báo BIDE.
Chuancong Gao

Những gì tôi đã làm cuối cùng được sử dụng: philippe-fournier-viger.com/spmf - Đó là một JAVA lib nhưng tôi đã bọc nó bằng trăn để phù hợp với nhu cầu của tôi
yossico

6

Tôi đang tích cực duy trì việc triển khai hiệu quả cả PrefixSpan và BIDE trong Python 3, hỗ trợ khai thác cả hai mẫu tuần tự thường xuyên và top-k (đóng).

https://github.com/chuanconggao/PrefixSpan-py


Tôi muốn triển khai những thứ đó trong javascript, nhưng tôi không hiểu đầy đủ về cách các thuật toán này hoạt động. Bạn có thể giải thích nó bằng tiếng Anh đơn giản?
inf3rno

Tôi đề nghị bạn kiểm tra triển khai PrefixSpan tối thiểu ban đầu của tôi. Phần cốt lõi của nó chỉ mất 15 dòng. gist.github.com/chuanconggao/4df9c1b06fa7f3ed854d5d96e2ae499f
Chuancong Gao

Cảm ơn! Tôi sẽ cố gắng dịch nó sang js, nhưng sẽ không dễ dàng. :-) Afaik PrefixSpan đang xây dựng cơ sở dữ liệu dự kiến ​​dựa trên nơi tiền tố khớp. Tôi hiện đang đọc về BIDE, lý thuyết là một thuật toán thậm chí còn tốt hơn.
inf3rno

Có quá nhiều sự khác biệt giữa bộ sưu tập js và python. Tôi đã không quản lý để sao chép mã trong js. Tôi sẽ thử lại sau.
inf3rno

Không chắc nó có giúp hay không, nhưng tôi có một phiên bản PrefixSpan khác của Scala. github.com/chuanconggao/PrefixSpan-scala Tuy nhiên, tôi khuyên bạn nên hiểu đầy đủ thuật toán trước khi thực hiện.
Chuancong Gao

1

Tôi đã sử dụng chức năng fpgrowth của fim trong quá khứ và nó hoạt động tốt. Tuy nhiên, thật khó để cài đặt trên các máy Windows. Nó dường như là một trang web học thuật vì vậy tôi không chắc liệu họ có thực hiện nhiều cập nhật cho mã theo thời gian không ...


1

Bạn đã xem xét để viết nó một mình? Bởi vì có lẽ không có thư viện duy trì cập nhật ngay bây giờ.

Hãy xem điều này, các mẫu cơ bản - PrefixSpan và Đóng / Tối đa thực sự không khó thực hiện:

http: // resultenceanalysis.github.io/


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.