Xem qua phần trình bày và tài liệu về Summingbird của Twitter, một trong những lý do được đề cập đến khi sử dụng các cụm Storm và Hadoop cùng nhau trong Summingbird là việc xử lý thông qua Storm dẫn đến xếp tầng lỗi. Để tránh xếp tầng lỗi và tích lũy của nó, cụm Hadoop được sử dụng để xử lý hàng loạt dữ liệu và loại bỏ kết quả Storm sau khi dữ liệu tương tự được Hadoop xử lý.
Các lý do cho việc tạo ra sự tích lũy lỗi này là gì? và tại sao nó không có trong Hadoop? Vì tôi chưa làm việc với Storm, tôi không biết lý do cho việc đó. Có phải vì Storm sử dụng một số thuật toán gần đúng để xử lý dữ liệu để xử lý chúng trong thời gian thực? hoặc là nguyên nhân cái gì khác?