Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này

1
Tính năng quan trọng với các tính năng phân loại cardinality cao cho hồi quy (biến phụ thuộc số)
Tôi đã cố gắng sử dụng các tính năng quan trọng từ Rừng ngẫu nhiên để thực hiện một số lựa chọn tính năng theo kinh nghiệm cho vấn đề hồi quy trong đó tất cả các tính năng là phân loại và rất nhiều trong số chúng có nhiều …





3
Cần giúp đỡ để hiểu đề xuất chia điểm gần đúng của xgboost
lý lịch: trong xgboost , lần lặp cố gắng khớp một cây f t trên tất cả n ví dụ nhằm giảm thiểu mục tiêu sau:tttftftf_tnnn ∑i=1n[gift(xi)+12hif2t(xi)]∑i=1n[gift(xi)+12hift2(xi)]\sum_{i=1}^n[g_if_t(x_i) + \frac{1}{2}h_if_t^2(x_i)] nơi là thứ tự đầu tiên và các dẫn xuất tự thứ hai qua trước chúng tôi ước lượng tốt nhất …
12 xgboost  gbm 




3
Trợ giúp về NER trong NLTK
Tôi đã làm việc trong NLTK một thời gian bằng Python. Vấn đề tôi gặp phải là họ không có trợ giúp về đào tạo NER về NLTK với dữ liệu tùy chỉnh của tôi. Họ đã sử dụng MaxEnt và đào tạo nó trên văn phòng ACE. Tôi đã …


2
Mô hình chuỗi thời gian cách đều nhau
Tôi có một biến liên tục, được lấy mẫu trong khoảng thời gian một năm tại các khoảng thời gian không đều. Một số ngày có nhiều hơn một quan sát mỗi giờ, trong khi các giai đoạn khác không có gì trong nhiều ngày. Điều này khiến việc phát …




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.