Câu hỏi được gắn thẻ «bigdata»

Dữ liệu lớn là thuật ngữ cho một tập hợp các tập dữ liệu lớn và phức tạp đến mức khó xử lý bằng các công cụ quản lý cơ sở dữ liệu trên tay hoặc các ứng dụng xử lý dữ liệu truyền thống. Các thách thức bao gồm nắm bắt, giám tuyển, lưu trữ, tìm kiếm, chia sẻ, chuyển giao, phân tích và trực quan hóa.




8
Python có phù hợp với dữ liệu lớn không
Tôi đã đọc trong bài viết này Có phải ngôn ngữ R phù hợp với Dữ liệu lớn mà dữ liệu lớn tạo thành 5TBvà trong khi nó cung cấp thông tin tốt về tính khả thi khi làm việc với loại dữ liệu Rnày thì nó cung cấp rất …
13 bigdata  python 

7
Một 'tên cũ' của nhà khoa học dữ liệu là gì?
Những thuật ngữ như 'khoa học dữ liệu' và 'nhà khoa học dữ liệu' ngày càng được sử dụng nhiều hơn trong những ngày này. Nhiều công ty đang tuyển dụng "nhà khoa học dữ liệu". Nhưng tôi không nghĩ đó là một công việc hoàn toàn mới. Dữ liệu …
12 bigdata 

2
Thuật toán kết hợp ưu tiên
Có dự án phụ này tôi đang làm việc ở nơi tôi cần cấu trúc một giải pháp cho vấn đề sau. Tôi có hai nhóm người (khách hàng). Nhóm Adự định mua và nhóm Bdự định bán một sản phẩm xác định X. Sản phẩm có một loạt các …



1
Tôi nên sử dụng bao nhiêu tế bào LSTM?
Có bất kỳ quy tắc nào (hoặc quy tắc thực tế) liên quan đến số lượng tế bào LSTM tối thiểu, tối đa và "hợp lý" mà tôi nên sử dụng không? Cụ thể tôi có liên quan đến BasicLSTMCell từ TensorFlow và num_unitstài sản. Hãy giả sử rằng tôi …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

2
FPGrowth có còn được coi là trạng thái của nghệ thuật trong việc khai thác mô hình thường xuyên không?
Theo như tôi biết về sự phát triển của các thuật toán để giải quyết vấn đề Khai thác mẫu thường xuyên (FPM), con đường cải tiến có một số điểm kiểm tra chính. Đầu tiên, thuật toán Apriori được đề xuất vào năm 1993, bởi Agrawal et al. , …

4
Làm việc với các cụm HPC
Trong trường đại học của tôi, chúng tôi có một cụm máy tính HPC. Tôi sử dụng cụm để đào tạo phân loại và như vậy. Vì vậy, thông thường, để gửi một công việc đến cụm, (ví dụ: tập lệnh python scikit-learn), tôi cần phải viết một tập lệnh …

3
Ngôn ngữ tốt nhất cho máy tính khoa học [đóng]
Đã đóng cửa . Câu hỏi này cần được tập trung hơn . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó chỉ tập trung vào một vấn đề bằng cách chỉnh sửa bài đăng này . Đóng …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 



3
Làm thế nào để các kỹ thuật thống kê khác nhau (hồi quy, PCA, v.v.) quy mô với kích thước và kích thước mẫu?
Có một bảng chung về các kỹ thuật thống kê giải thích cách chúng chia tỷ lệ với kích thước và kích thước mẫu không? Ví dụ, một người bạn của tôi đã nói với tôi vào một ngày khác rằng thời gian tính toán đơn giản là sắp xếp …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.