Tôi đang cố gắng hiểu làm thế nào tất cả các thành phần "dữ liệu lớn" kết hợp với nhau trong trường hợp sử dụng trong thế giới thực, ví dụ: hadoop, monogodb / nosql, bão, kafka, ... Tôi biết rằng đây là một loạt các công cụ được sử dụng cho các loại khác nhau, nhưng tôi muốn biết thêm về sự tương tác của chúng trong các ứng dụng, ví dụ như suy nghĩ học máy cho một ứng dụng, webapp, cửa hàng trực tuyến.
Tôi có vistors / phiên, dữ liệu giao dịch, vv và lưu trữ đó; nhưng nếu tôi muốn đưa ra các đề xuất một cách nhanh chóng, tôi không thể chạy các bản đồ chậm / giảm việc làm cho điều đó trên một số cơ sở dữ liệu lớn về nhật ký mà tôi có. Tôi có thể tìm hiểu thêm về các khía cạnh cơ sở hạ tầng ở đâu? Tôi nghĩ rằng tôi có thể tự mình sử dụng hầu hết các công cụ, nhưng cắm chúng vào nhau dường như là một nghệ thuật của riêng nó.
Có bất kỳ ví dụ công khai / trường hợp sử dụng vv có sẵn? Tôi hiểu rằng các đường ống riêng lẻ phụ thuộc rất nhiều vào trường hợp sử dụng và người dùng, nhưng chỉ là ví dụ có thể sẽ rất hữu ích với tôi.