Câu hỏi được gắn thẻ «text-mining»

Đề cập đến một tập hợp khai thác dữ liệu liên quan đến việc trích xuất thông tin từ dữ liệu dưới dạng văn bản bằng cách nhận dạng các mẫu. Mục tiêu của khai thác văn bản thường là phân loại một tài liệu nhất định thành một trong một số loại theo cách tự động và để cải thiện hiệu suất này một cách linh hoạt, biến nó thành một ví dụ về học máy. Một ví dụ về loại khai thác văn bản này là các bộ lọc thư rác được sử dụng cho email.

3
Một ví dụ: Hồi quy LASSO bằng glmnet cho kết quả nhị phân
Tôi bắt đầu say mê với việc sử dụng glmnetvới LASSO Regression trong đó kết quả quan tâm của tôi là phân đôi. Tôi đã tạo một khung dữ liệu giả nhỏ bên dưới: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Lớp 'Nhúng' của Keras hoạt động như thế nào?
Cần hiểu hoạt động của lớp 'Nhúng' trong thư viện Keras. Tôi thực thi đoạn mã sau trong Python import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) cung cấp đầu …



4
Kỹ thuật máy học để phân tích chuỗi?
Tôi có rất nhiều chuỗi địa chỉ: 1600 Pennsylvania Ave, Washington, DC 20500 USA Tôi muốn phân tích chúng thành các thành phần của chúng: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Nhưng tất nhiên dữ liệu là bẩn: nó đến từ nhiều quốc gia …





7
Trong Naive Bayes, tại sao phải bận tâm với việc làm mịn Laplace khi chúng ta có những từ chưa biết trong bộ thử nghiệm?
Tôi đã đọc qua Phân loại Naive Bayes ngày hôm nay. Tôi đọc, dưới tiêu đề Ước tính tham số với thêm 1 làm mịn : Hãy để ccc tham khảo một lớp (chẳng hạn như Tích cực hoặc Tiêu cực) và để www tham khảo mã thông báo hoặc …



1
Hiệu suất hiện đại được báo cáo của việc sử dụng vectơ đoạn để phân tích tình cảm đã được nhân rộng?
Tôi đã rất ấn tượng với kết quả trong bài báo " Các đại diện phân phát về câu và tài liệu " của ICML 2014 của Le và Mikolov. Kỹ thuật mà họ mô tả, được gọi là "vectơ đoạn", học các biểu diễn không được giám sát của …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.