Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này


1
Đào tạo Độ chính xác vs Kiểm tra Độ chính xác vs Ma trận nhầm lẫn
Sau khi tôi phát triển mô hình dự đoán của mình bằng Rừng ngẫu nhiên, tôi nhận được các số liệu sau: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Đây là kết quả từ mã này: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], …






2
Word2Vec nhúng với TF-IDF
Khi bạn huấn luyện mô hình word2vec (ví dụ sử dụng gensim), bạn cung cấp một danh sách các từ / câu. Nhưng dường như không có cách nào để xác định trọng số cho các từ được tính ví dụ bằng TF-IDF. Là cách thông thường để nhân các …




3
Ngôn ngữ tốt nhất cho máy tính khoa học [đóng]
Đã đóng cửa . Câu hỏi này cần được tập trung hơn . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó chỉ tập trung vào một vấn đề bằng cách chỉnh sửa bài đăng này . Đóng …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 


3
XGboost - Lựa chọn theo mô hình
tôi đang sử dụng XGboost để dự đoán biến mục tiêu 2 lớp trên các yêu cầu bảo hiểm. Tôi có một mô hình (đào tạo với xác nhận chéo, điều chỉnh siêu tham số, v.v.) tôi chạy trên một tập dữ liệu khác. Câu hỏi của tôi là : …
10 xgboost 


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.