Khoa học dữ liệu

Hỏi và đáp cho các chuyên gia khoa học dữ liệu, các chuyên gia về Machine Learning và những người quan tâm đến việc tìm hiểu thêm về lĩnh vực này


4
Công cụ khoa học dữ liệu sử dụng Scala
Tôi biết rằng Spark được tích hợp hoàn toàn với Scala. Trường hợp sử dụng dành riêng cho các tập dữ liệu lớn. Những công cụ khác có hỗ trợ Scala tốt? Scala có phù hợp nhất với các tập dữ liệu lớn hơn không? Hoặc nó cũng phù hợp …







2
K-nghĩa so với K-nghĩa trực tuyến
K-mean là một thuật toán nổi tiếng để phân cụm, nhưng cũng có một biến thể trực tuyến của thuật toán đó (K-mean trực tuyến). Những ưu và nhược điểm của các phương pháp này là gì và khi nào nên được ưu tiên?

5
Dự đoán tương tự câu
Tôi đang tìm cách giải quyết vấn đề sau: Tôi có một bộ câu làm tập dữ liệu của mình và tôi muốn có thể gõ một câu mới và tìm câu mà câu mới giống với câu nhất trong tập dữ liệu. Một ví dụ sẽ giống như: Câu …

2
Phân cụm khách truy cập duy nhất theo useragent, ip, session_id
Đưa ra dữ liệu truy cập trang web trong biểu mẫu session_id, ip, user_agentvà dấu thời gian tùy chọn, theo các điều kiện bên dưới, làm thế nào tốt nhất bạn có thể phân cụm các phiên thành khách truy cập duy nhất? session_id: là một id được cung cấp …
15 clustering 

4
Bây giờ gấu trúc có nhanh hơn data.table không?
https://github.com/Rdatitable/data.table/wiki/Benchmark-%3A-Grouping Các điểm chuẩn data.table chưa được cập nhật từ năm 2014. Tôi nghe thấy ở đâu đó Pandasnhanh hơn data.table. Điều này có đúng không? Có ai đã làm bất kỳ điểm chuẩn? Tôi chưa bao giờ sử dụng Python trước đây nhưng sẽ xem xét chuyển đổi nếu …
15 python  r  pandas  data  data.table 

2
Khoa học dữ liệu mà không có kiến ​​thức về một chủ đề cụ thể, nó có đáng để theo đuổi như một nghề nghiệp không? [đóng cửa]
Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Trao đổi ngăn xếp khoa học dữ liệu. Đóng cửa 5 năm trước . …



Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.