Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này

1
Dữ liệu mất cân bằng gây ra phân loại sai trên tập dữ liệu đa lớp
Tôi đang làm việc về phân loại văn bản nơi tôi có 39 danh mục / lớp và 8,5 triệu hồ sơ. (Trong dữ liệu và danh mục trong tương lai sẽ tăng). Cấu trúc hoặc định dạng của dữ liệu của tôi là như sau. ---------------------------------------------------------------------------------------- | product_title | …




1
Làm cách nào để tiếp cận vấn đề phân loại trong đó một trong các lớp được định nghĩa bởi 'không phải bất kỳ lớp nào khác'
Giả sử rằng tôi quan tâm đến ba lớp , , . Nhưng tập dữ liệu của tôi thực sự chứa nhiều lớp thực hơn .c1c1c_1c2c2c_2c3c3c_3(cj)nj=4(cj)j=4n(c_j)_{j=4}^n Câu trả lời rõ ràng là định nghĩa một lớp mới đề cập đến tất cả các lớp , nhưng tôi nghi ngờ đây …



4
Phân loại chuỗi thời gian đa biến
Tôi có một bộ dữ liệu gồm chuỗi thời gian (8 điểm) với khoảng 40 thứ nguyên (vì vậy mỗi chuỗi thời gian là 8 x 40). Các tham số tương ứng (kết quả có thể có cho các danh mục) là eitheir 0 hoặc 1. Điều gì sẽ là …

3
Tại sao không đào tạo mô hình cuối cùng trên toàn bộ dữ liệu sau khi thực hiện dữ liệu kiểm tra cơ sở điều chỉnh siêu chuẩn và dữ liệu xác thực cơ sở lựa chọn mô hình?
Theo toàn bộ dữ liệu, ý tôi là đào tạo + kiểm tra + xác nhận Khi tôi đã sửa lỗi siêu tham số của mình bằng dữ liệu xác thực và chọn mô hình sử dụng dữ liệu thử nghiệm, sẽ tốt hơn nếu có một mô hình được …







Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.