Câu hỏi được gắn thẻ «feature-construction»

Kỹ thuật tính năng là quá trình sử dụng kiến ​​thức miền về dữ liệu để tạo ra các tính năng cho các mô hình học máy. Thẻ này có nghĩa cho cả câu hỏi lý thuyết và thực tế liên quan đến kỹ thuật tính năng, ngoại trừ các câu hỏi yêu cầu mã, sẽ không có chủ đề trên CrossValidated.

2
Hiểu tính năng băm
Wikipedia cung cấp ví dụ sau khi mô tả tính năng băm ; nhưng ánh xạ có vẻ không phù hợp với từ điển được định nghĩa Ví dụ, tonên được chuyển đổi 3theo từ điển, nhưng nó được mã hóa 1thay thế. Có một lỗi trong mô tả? Làm …




6
Cách chuẩn bị / xây dựng các tính năng để phát hiện bất thường (dữ liệu bảo mật mạng)
Mục tiêu của tôi là phân tích nhật ký mạng (ví dụ: Apache, syslog, kiểm toán bảo mật Active Directory, v.v.) bằng cách sử dụng phát hiện phân cụm / dị thường cho mục đích phát hiện xâm nhập. Từ nhật ký, tôi có rất nhiều trường văn bản như …




1
Mã hóa các tính năng phân loại cao (nhiều loại) khi các tính năng khác nhau rất nhiều về tính chính xác
Tôi đã xem qua các câu hỏi liên quan đến mã hóa tính năng phân loại, nhưng không thể tìm thấy bất kỳ điều gì thảo luận về vấn đề của tôi. Xin lỗi nếu tôi bỏ lỡ nó. Giả sử chúng ta có một bộ dữ liệu với các …

2
Tại sao một mô hình thống kê sẽ phù hợp hơn nếu được cung cấp một bộ dữ liệu khổng lồ?
Dự án hiện tại của tôi có thể yêu cầu tôi xây dựng một mô hình để dự đoán hành vi của một nhóm người nhất định. tập dữ liệu huấn luyện chỉ chứa 6 biến (id chỉ dành cho mục đích nhận dạng): id, age, income, gender, job category, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.