Tôi đã gặp phải vấn đề sau đây, rằng tôi điều chỉnh lại khá điển hình.
Tôi có một số dữ liệu lớn, giả sử, một vài triệu hàng. Tôi chạy một số phân tích không tầm thường trên nó, ví dụ như một truy vấn SQL bao gồm một số truy vấn phụ. Tôi nhận được một số kết quả, ví dụ, thuộc tính X đó đang tăng theo thời gian.
Bây giờ, có hai điều có thể dẫn đến điều đó:
- X thực sự đang tăng theo thời gian
- Tôi có một lỗi trong phân tích của tôi
Làm thế nào tôi có thể kiểm tra rằng lần đầu tiên xảy ra, chứ không phải lần thứ hai? Trình gỡ lỗi từng bước, ngay cả khi có tồn tại, sẽ không có ích, vì kết quả trung gian vẫn có thể bao gồm hàng triệu dòng.
Điều duy nhất tôi có thể nghĩ đến là bằng cách nào đó tạo ra một tập hợp dữ liệu nhỏ, tổng hợp với thuộc tính mà tôi muốn kiểm tra và chạy phân tích trên đó dưới dạng thử nghiệm đơn vị. Có công cụ để làm điều này? Đặc biệt, nhưng không giới hạn, SQL.