Tôi đang đọc về kiến trúc lambda.
Nó có ý nghĩa. chúng tôi có hàng đợi dựa trên dữ liệu nhập. chúng tôi có một kho lưu trữ trong bộ nhớ cho dữ liệu rất mới và chúng tôi có HDFS cho dữ liệu cũ.
Vì vậy, chúng tôi có toàn bộ dữ liệu của chúng tôi. trong hệ thống của chúng tôi. rất tốt.
nhưng sơ đồ kiến trúc cho thấy lớp hợp nhất có thể truy vấn cả lớp lô và lớp tốc độ trong một lần chụp.
Làm thế nào để làm điều đó?
Lớp lô của bạn có thể là một công việc giảm bản đồ hoặc truy vấn HIVE. Truy vấn lớp tốc độ có lẽ là một chương trình scala được thực thi trên tia lửa.
Bây giờ bạn sẽ hợp nhất những thứ này như thế nào?
Có hướng dẫn nào không.