Hiện tại, tôi đang so sánh hai bộ dữ liệu có chứa các StoreKey/ProductKey
kết hợp duy nhất .
Tập dữ liệu đầu tiên có các StoreKey/ProductKey
kết hợp duy nhất cho doanh số từ đầu tháng 1 năm 2012 đến cuối tháng 5 năm 2014 (kết quả = 450K dòng). Tập dữ liệu thứ 2 có các StoreKey/ProductKey
kết hợp duy nhất , để bán bắt đầu từ tháng 6 năm 2014, cho đến ngày hôm nay (kết quả = 190K dòng).
Tôi đang tìm kiếm các StoreKey/ProductKey
kết hợp trong tập 2, nhưng không phải trong tập 1 - tức là các sản phẩm mới được bán từ đầu tháng Sáu.
Cho đến bây giờ, tôi đã đổ hai bộ dữ liệu vào các bảng tạm thời, tạo các chỉ mục cho cả hai bảng trên cả hai khóa và sử dụng EXCEPT
câu lệnh để tìm các mục duy nhất.
Cách hiệu quả nhất để so sánh các tập dữ liệu lớn như vậy là gì? Có cách nào hiệu quả hơn để làm loại so sánh lớn này không?