Câu trả lời:
Có thể đáng để xem sách của MW Berry:
Chúng bao gồm một loạt các giấy tờ áp dụng và xem xét. Bản mới nhất dường như có sẵn dưới dạng PDF tại địa chỉ sau: http://bit.ly/deNeiy .
Dưới đây là một số liên kết liên quan đến CA như được áp dụng để khai thác văn bản:
Bạn cũng có thể xem Phân tích ngữ nghĩa tiềm ẩn , nhưng hãy xem phản hồi của tôi ở đó: Làm việc thông qua một vấn đề phân cụm .
Tìm nhóm trong dữ liệu. Giới thiệu về Phân tích cụm từ các giáo sư Leonard Kaufman và Peter J. Rousseeuw.
Tôi đang đọc cuốn sách và thấy nó rất hữu ích vì:
Mục đích của chúng tôi là viết một cuốn sách ứng dụng cho người dùng phổ thông. Chúng tôi muốn cung cấp phân tích cụm cho những người không nhất thiết phải có nền tảng toán học hoặc thống kê mạnh.
Nó cung cấp nội dung lý thuyết để hiểu các chức năng có sẵn trong R
gói Cụm .
Các chương có thể được đọc riêng theo phương pháp cụm quan tâm.
ngoại lệ là chương 3, được xây dựng trên chương 2
Các chương của cuốn sách là:
Người giới thiệu:
Kaufman, L., & Rousseeuw, PJ (2005). Tìm nhóm trong dữ liệu. Giới thiệu về Phân tích cụm (trang 342). John Wiley & Sons Inc.
Maechler, M. (2013). Phân tích cụm mở rộng Rousseeuw et al. CRAN.
Chương này của Giới thiệu về Khai thác dữ liệu có sẵn trực tuyến và cung cấp một cái nhìn tổng quan đẹp.
Không đặc biệt về khai thác văn bản, nhưng tôi khá thích "Phân tích dữ liệu khám phá với MATLAB" của Martinez và Martinez.
Một cuốn sách chuyên sâu khác đáng xem: Sổ tay phân tích cụm của Hennig et al. (2015)