Vừa mới bắt đầu tự học Máy học và phân tích dữ liệu Tôi thấy mình đang gặp phải một bức tường gạch về nhu cầu tạo và truy vấn các bộ dữ liệu lớn. Tôi muốn lấy dữ liệu tôi đã tổng hợp trong cuộc sống chuyên nghiệp và cá nhân của mình và phân tích nó nhưng tôi không chắc chắn về cách tốt nhất để làm như sau:
Tôi nên lưu trữ dữ liệu này như thế nào? Excel? SQL? ??
Một cách tốt để người mới bắt đầu cố gắng phân tích dữ liệu này là gì? Tôi là một lập trình viên máy tính chuyên nghiệp nên sự phức tạp không nằm ở việc viết chương trình mà ít nhiều cụ thể đối với lĩnh vực phân tích dữ liệu.
EDIT: Xin lỗi vì sự mơ hồ của tôi, khi bạn mới bắt đầu tìm hiểu về điều gì đó thật khó để biết những gì bạn không biết, bạn biết không? ;)
Phải nói rằng, mục tiêu của tôi là áp dụng điều này vào hai chủ đề chính:
Số liệu của nhóm phần mềm (nghĩ vận tốc Agile, định lượng rủi ro, khả năng lặp lại hoàn thành thành công với x số điểm câu chuyện)
Học máy (ví dụ ngoại lệ hệ thống đã xảy ra trong một tập hợp các mô-đun nhất định, khả năng mô-đun sẽ đưa ra một ngoại lệ trong trường, chi phí đó là bao nhiêu, dữ liệu có thể cho tôi biết về các mô-đun chính để cải thiện điều gì sẽ cải thiện cho tôi tiếng nổ tốt nhất, dự đoán phần nào của hệ thống mà người dùng sẽ muốn sử dụng tiếp theo để bắt đầu tải dữ liệu, v.v.).