Câu hỏi được gắn thẻ «scikit-learn»

Scikit-learn là một mô-đun Python bao gồm công cụ đơn giản và hiệu quả để học máy, khai thác dữ liệu và phân tích dữ liệu. Nó được xây dựng trên NumPy, SciPy và matplotlib. Nó được phân phối theo giấy phép BSD 3 khoản.

2
Phương pháp hiệu quả nhất để tối ưu hóa siêu tham số trong scikit-learn là gì?
Tổng quan về quá trình tối ưu hóa siêu tham số trong scikit-learn có ở đây . Tìm kiếm lưới đầy đủ sẽ tìm thấy bộ siêu đường kính tối ưu cho một mô hình. Nhược điểm là tìm kiếm lưới đầy đủ là chậm. Tìm kiếm ngẫu nhiên nhanh …

2
Là max_depth trong scikit tương đương với việc cắt tỉa trong cây quyết định?
Tôi đã phân tích trình phân loại được tạo bằng cây quyết định. Có một tham số điều chỉnh được gọi là max_depth trong cây quyết định của scikit. Đây có phải là tương đương với việc cắt tỉa một cây quyết định? Nếu không, làm thế nào tôi có …

3
Mối liên quan giữa tích chập trong toán học và CNN
Tôi đã đọc giải thích về tích chập và hiểu nó ở một mức độ nào đó. Ai đó có thể giúp tôi hiểu hoạt động này liên quan đến sự tích chập trong Mạng lưới thần kinh Convolutional như thế nào không? Là bộ lọc như chức năng gáp …
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3

1
Dữ liệu mất cân bằng gây ra phân loại sai trên tập dữ liệu đa lớp
Tôi đang làm việc về phân loại văn bản nơi tôi có 39 danh mục / lớp và 8,5 triệu hồ sơ. (Trong dữ liệu và danh mục trong tương lai sẽ tăng). Cấu trúc hoặc định dạng của dữ liệu của tôi là như sau. ---------------------------------------------------------------------------------------- | product_title | …


3
Xuất trọng lượng (công thức) từ Công cụ hồi quy rừng ngẫu nhiên trong Scikit-Learn
Tôi đã đào tạo một mô hình dự đoán với Scikit Learn in Python (Random Forest Regressor) và tôi muốn trích xuất trọng lượng của từng tính năng để tạo ra một công cụ excel để dự đoán thủ công. Điều duy nhất tôi tìm thấy là model.feature_importances_nhưng nó không …







2
Tại sao hồi quy Gradient Boosting dự đoán các giá trị âm khi không có giá trị y âm trong tập huấn luyện của tôi?
Như tôi đã tăng số lượng cây trong scikit học 's GradientBoostingRegressor, tôi nhận được những dự đoán tiêu cực hơn, mặc dù không có giá trị tiêu cực trong đào tạo hoặc kiểm tra thiết lập của tôi. Tôi có khoảng 10 tính năng, hầu hết là nhị phân. …

3
Xác thực chéo lồng nhau và chọn mô hình hồi quy tốt nhất - đây có phải là quy trình SKLearn đúng không?
Nếu tôi hiểu chính xác, lồng nhau-CV có thể giúp tôi đánh giá mô hình và quy trình điều chỉnh siêu tham số nào là tốt nhất. Vòng lặp bên trong ( GridSearchCV) tìm ra các siêu đường kính tốt nhất và vòng lặp outter ( cross_val_score) đánh giá thuật …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.