Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này


1
Có bao nhiêu tính năng để lấy mẫu bằng cách sử dụng Rừng ngẫu nhiên
Các trang Wikipedia mà dấu ngoặc kép "The Elements of Learning thống kê" cho biết: Thông thường, đối với một vấn đề phân loại với các tính năng , các tính năng được sử dụng trong mỗi lần phân chia.ppp⌊ p-√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Tôi hiểu rằng đây là một phỏng đoán …

1
XGBRegressor so với xgboost.train chênh lệch tốc độ rất lớn?
Nếu tôi huấn luyện mô hình của mình bằng mã sau: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) nó kết thúc sau khoảng 1 phút Nếu tôi huấn …



1
Bản đồ nhiệt trên bản đồ trong Python
Chế độ phân tích có một tính năng bản đồ nhiệt đẹp ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Nhưng nó không có lợi cho việc so sánh các bản đồ (chỉ có một bản báo cáo). Những gì họ làm cho phép là dữ liệu được kéo dễ dàng vào một cuốn sổ …





2
Hồi quy tuyến tính với hàm chi phí không đối xứng?
Tôi muốn dự đoán một số giá trị và tôi đang cố gắng để có được một số dự đoán tối ưu hóa giữa mức thấp nhất có thể, nhưng vẫn lớn hơn . Nói cách khác: Y(x)Y(x)Y(x)Y^(x)Y^(x)\hat Y(x)Y(x)Y(x)Y(x)cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}\text{cost}\left\{ Y(x) \gtrsim \hat Y(x) \right\} >> \text{cost}\left\{ \hat Y(x) \gtrsim Y(x) …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.