Tôi thường tự tạo, sử dụng một số dữ liệu đã biết làm đầu vào - nếu quá ngẫu nhiên, nó không phải lúc nào cũng là một thử nghiệm tốt; Tôi cần dữ liệu sẽ được phân phối tương tự như sản phẩm cuối cùng của tôi.
Tất cả các cơ sở dữ liệu lớn hơn mà tôi phải điều chỉnh đều có bản chất khoa học - vì vậy tôi thường có thể lấy một số điều tra khác làm đầu vào, và hủy bỏ nó và thêm jitter. (ví dụ: lấy dữ liệu ở tốc độ 5 phút với độ chính xác đến mili giây và biến nó thành nhịp chính xác 10 giây với độ chính xác milimet giây nhưng độ biến thiên +/- 100 ms theo thời gian)
...
Nhưng, như một cách khác, nếu bạn không muốn tự viết, hãy xem một số công cụ đo điểm chuẩn - vì chúng có thể lặp đi lặp lại nhiều lần dựa trên tập huấn luyện, bạn có thể sử dụng chúng để chèn rất nhiều các bản ghi (và sau đó chỉ cần bỏ qua các báo cáo về tốc độ của nó) ... và sau đó bạn có thể sử dụng cùng một công cụ đó để kiểm tra tốc độ của cơ sở dữ liệu khi nó được tạo ra.