"Làm thế nào để bạn xử lý được cung cấp một bộ dữ liệu, nhưng không có mục tiêu rõ ràng?"
Điều này sẽ phổ biến.
Ngoài những lời khuyên ở trên, hãy hiểu rằng điều cần thiết là phải hiểu các mục tiêu của doanh nghiệp bạn đang làm và của khách hàng trực tiếp của bạn. Thường thì bạn sẽ cần phải hiểu vấn đề cụ thể khiến họ chuyển sang dữ liệu tốt hơn họ. Rất phổ biến khi được trình bày dữ liệu và mục tiêu không rõ ràng từ khách hàng nội bộ hoặc bên ngoài của bạn - thường sẽ là nhiệm vụ của bạn để cung cấp mục tiêu có thể đạt được với dữ liệu và sẽ giải quyết vấn đề kinh doanh thực tế của khách hàng. Một lượng suy nghĩ bên sẽ được yêu cầu để làm cho kết quả dữ liệu và giải pháp kinh doanh phù hợp.
Tôi sẽ tóm tắt những điều trên là 'xác định mục tiêu là quá quan trọng (và có thể quá khó!) Để lại cho khách hàng (một mình)'.
Trong ngữ cảnh học máy, CRISP-DM là một phương pháp cố gắng giải quyết vấn đề này bằng cách lặp qua một vòng lặp để có thể sử dụng hiểu dữ liệu bổ sung trong cuộc thảo luận với khách hàng để hiểu rõ hơn vấn đề ban đầu. Vì vậy, ví dụ, họ có thể nêu ra một mục tiêu không xác định, một cuộc thảo luận thứ hai sau khi bạn thực hiện một số EDA sẽ làm sắc nét nó một chút. Sau này, khi bạn sản xuất một mô hình hoạt động tốt, nhưng không hoàn toàn đúng mục tiêu, bạn sẽ lại gần với mục tiêu kinh doanh thực sự.
Nói cách khác, đừng quá băn khoăn trước sự mờ nhạt của nhiệm vụ. Dự kiến sẽ gặp một vắc-xin, và điền vào lợi thế của bạn.
Đó là một sự thay đổi nhỏ sang một bên, nhưng sáu phương pháp sigma cố gắng giải quyết vấn đề này trong một bối cảnh khác với hệ thống DMAIC ('D' là viết tắt của 'Xác định', theo nghĩa 'tiếng nói của khách hàng'), vì vậy nó là có thể có một số mẹo có thể được lượm lặt trong các tài nguyên cho sáu bối cảnh sigma (ví dụ: các bài tập bạn có thể làm với một khách hàng giúp họ thể hiện những gì bạn muốn rõ ràng hơn)