Một người bạn của tôi đã gợi ý rằng ngành công nghiệp phần mềm chủ yếu cần các kỹ năng "dữ liệu lớn", chứ không phải các kỹ năng thống kê.
Mặc dù đồng ý một phần với nhận xét của bạn bè, tôi muốn chỉ ra rằng trong bất kỳ ngành nào, các công cụ dữ liệu lớn đều được chọn, chỉ khi tất cả các V đều hài lòng.
Tôi làm trưởng phòng khoa học dữ liệu tại một công ty hỗ trợ khách hàng hàng đầu. Ở đây, tôi thực hiện hack dữ liệu cho cả sản phẩm và cho sự phát triển của công ty.
Tôi chủ yếu sử dụng các kỹ thuật phân tích chuỗi thời gian để dự đoán và phân tích doanh số. Điều này cũng bao gồm phân tích hành vi của khách hàng, cạnh tranh và ngành công nghiệp.
Về phía sản phẩm, chúng tôi sử dụng một loạt các kỹ thuật bắt đầu từ phân tích tình cảm bằng LSTM, thuật toán đề xuất, v.v.
Nhưng trọng tâm cốt lõi nằm ở phân tích chuỗi thời gian. Quy trình công việc chung sẽ là:
- Làm sạch và đúc dữ liệu.
- các phân tích thăm dò và giải thích liên quan đến việc xác định tính thời vụ, xu hướng và chu kỳ. Vì vậy, người ta cần khám phá các mối tương quan, tương quan tự động và một số thống kê đơn biến và bivariate; cùng với âm mưu bao quát bao gồm các đường cong phân tán, AFC, PAFC.
- Bây giờ đến phần dự báo, trong đó các mô hình khác nhau được thử nghiệm lẫn nhau, thực hiện bước 2 - xem xét nghiêm túc.
Công cụ được tôi sử dụng: R, Python và Excel đôi khi.
Và ngay cả sự pha trộn giữa khoa học dữ liệu và hack tăng trưởng đã được chứng minh là làm nên điều kỳ diệu trong lĩnh vực tiếp thị. Vì vậy, nhu cầu cho các nhà thống kê và mọt sách toán học sẽ vẫn như cũ; và sẽ không từ chối bất cứ nơi nào trong tương lai gần; đặc biệt là khi các khách hàng khởi nghiệp tập trung đang nở rộ trên toàn thế giới.