Câu hỏi được gắn thẻ «text-mining»

Đề cập đến một tập hợp khai thác dữ liệu liên quan đến việc trích xuất thông tin từ dữ liệu dưới dạng văn bản bằng cách nhận dạng các mẫu. Mục tiêu của khai thác văn bản thường là phân loại một tài liệu nhất định thành một trong một số loại theo cách tự động và để cải thiện hiệu suất này một cách linh hoạt, biến nó thành một ví dụ về học máy. Một ví dụ về loại khai thác văn bản này là các bộ lọc thư rác được sử dụng cho email.


1
Word2vec cần bao nhiêu dữ liệu đào tạo?
Tôi muốn so sánh sự khác biệt giữa cùng một từ được đề cập trong các nguồn khác nhau. Đó là, cách các tác giả khác nhau trong cách sử dụng các từ không xác định, chẳng hạn như "dân chủ". Một kế hoạch ngắn gọn là Lấy những cuốn …

3

2
Khi nào nên chọn hồi quy tuyến tính hoặc cây quyết định hoặc hồi quy rừng ngẫu nhiên? [đóng cửa]
Đã đóng cửa . Câu hỏi này cần được tập trung hơn . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó chỉ tập trung vào một vấn đề bằng cách chỉnh sửa bài đăng này . Đóng …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 

2
Những kỹ thuật máy / học sâu / nlp nào được sử dụng để phân loại một từ đã cho là tên, số điện thoại di động, địa chỉ, email, tiểu bang, quận, thành phố, v.v.
Tôi đang cố gắng tạo ra một mô hình thông minh có thể quét một tập hợp các từ hoặc chuỗi và phân loại chúng thành tên, số điện thoại di động, địa chỉ, thành phố, tiểu bang, quốc gia và các thực thể khác bằng cách sử dụng máy …




4
Phân loại email trong R
Tôi đang làm việc trong một dự án ở R nơi tôi có khoảng 1200 email từ một công ty, hầu hết trong số đó được gắn nhãn lớp 1 hoặc lớp , là các loại yêu cầu. Khoảng 1000 email được dán nhãn lớp và 200 email được gắn …




1
Lỗi R khi sử dụng gói tm (khai thác văn bản)
Tôi đang cố gắng sử dụng gói tm để chuyển đổi một vectơ của chuỗi văn bản thành phần tử khối. Mã của tôi trông giống như thế này Corpus(d1$Yes) trong đó d1$Yesmột yếu tố với 124 cấp độ, mỗi cấp có chứa một chuỗi văn bản. Ví dụ, d1$Yes[246] …
8 r  text-mining 



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.