Vì vậy, kịch bản như sau:
Tôi có nhiều trường hợp của một dịch vụ web ghi một khối dữ liệu vào Azure Storage. Tôi cần có thể nhóm các đốm màu vào một vùng chứa (hoặc một thư mục ảo) tùy thuộc vào thời điểm nhận được. Thỉnh thoảng (tệ nhất là mỗi ngày) các đốm màu cũ hơn sẽ được xử lý và sau đó bị xóa.
Tôi có hai lựa chọn:
lựa chọn 1
Tôi tạo một vùng chứa có tên là "blobs" (ví dụ) và sau đó lưu trữ tất cả các blog vào vùng chứa đó. Mỗi blob sẽ sử dụng tên kiểu thư mục với tên thư mục là thời điểm nhận được (ví dụ: "hr0min0 / data.bin", "hr0min0 / data2.bin", "hr0min30 / data3.bin", "hr1min45 / data.bin" ", ...," hr23min0 / dataN.bin ", v.v. - một thư mục mới cứ sau X phút). Thứ xử lý các đốm màu này sẽ xử lý các đốm màu hr0min0 trước, sau đó là hr0minX, v.v. (và các đốm màu vẫn đang được viết khi được xử lý).
Lựa chọn 2
Tôi có nhiều vùng chứa, mỗi vùng chứa có tên dựa trên thời gian đến (vì vậy đầu tiên sẽ là vùng chứa có tên blobs_hr0min0 sau đó là blobs_hr0minX, v.v.) và tất cả các đốm màu trong vùng chứa là những đốm màu đã đến vào thời điểm được đặt tên. Quá trình xử lý các blog này sẽ xử lý một vùng chứa tại một thời điểm.
Vì vậy, câu hỏi của tôi là, lựa chọn nào tốt hơn? Tùy chọn 2 có cung cấp cho tôi khả năng song song tốt hơn (vì một vùng chứa có thể nằm trong các máy chủ khác nhau) hay là tùy chọn 1 tốt hơn vì nhiều vùng chứa có thể gây ra các sự cố không xác định khác?