Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này

1
Một số tình huống khi bình thường hóa dữ liệu đầu vào có nghĩa là không, phương sai đơn vị là không phù hợp hoặc không có lợi?
Tôi đã thấy bình thường hóa dữ liệu đầu vào có nghĩa là không, phương sai đơn vị nhiều lần trong học máy. Đây có phải là một thực hành tốt để được thực hiện tất cả các thời gian hoặc có những lúc nó không phù hợp hoặc không …


6
Có nên kết hợp hai tập dữ liệu?
Tôi có hai bộ dữ liệu về nhịp tim của các đối tượng được ghi nhận ở hai nơi khác nhau (chính xác là hai lục địa khác nhau). Hai thí nghiệm nghiên cứu nhằm tìm cảm xúc của các đối tượng dựa trên nhịp tim của họ thay đổi …




1
Chức năng khách quan để phân loại đa nhãn
Hàm mục tiêu thông thường cho phân loại nhiều nhãn (ví dụ nhãn M) là entropy chéo nhị phân. Vấn đề là, nếu chúng ta sử dụng entropy nhị phân chéo, chúng ta giả định rằng các nhãn đầu ra độc lập với nhau, chuyển vấn đề sang các vấn …

1
Giả định hồi quy tuyến tính
Nói một cách đơn giản, các giả định của hồi quy tuyến tính là gì? Tôi chỉ muốn biết rằng khi tôi có thể áp dụng mô hình hồi quy tuyến tính cho tập dữ liệu của chúng tôi.

1
Người ta có thể xây dựng các mô hình tuyến tính trên các khối dữ liệu của bộ dữ liệu không, nếu một người không thể xây dựng chúng trên toàn bộ tập dữ liệu?
Người ta có thể xây dựng các mô hình tuyến tính trên "khối" của tập dữ liệu không, nếu người ta không thể xây dựng chúng trên toàn bộ tập dữ liệu? Đặc biệt, tôi vẫn còn hơn 88k biến (tính năng) và người ta không thể làm gì nhiều …


1
Túi từ ngữ trực quan
Những gì tôi đang cố gắng làm: Tôi đang cố gắng phân loại một số hình ảnh bằng cách sử dụng các tính năng địa phương và toàn cầu. Những gì tôi đã làm cho đến nay: Tôi đã trích xuất các mô tả sàng lọc cho mỗi hình ảnh …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.