Lý lịch:
Tôi hiện đang chạy một thí nghiệm biến thể tham số số lượng lớn. Chúng đang được chạy trong Python 2.6+, sử dụng numpy. Những thí nghiệm này sẽ mất khoảng 2 tuần để chạy.
Gần như tôi đang thay đổi 3 tham số (biến độc lập) trên một phạm vi giá trị. Tôi đang sửa 6 biến độc lập hơn nữa (hiện tại) Tôi đang báo cáo về 4 biến phụ thuộc.
Một trong những tham số tôi đang thay đổi đang được phân phối trên một số quy trình (và máy tính). Đối với mỗi tham số này, tôi tạo một csv
tệp riêng với mỗi hàng chứa giá trị của tất cả các biến (bao gồm độc lập, cố định và phụ thuộc). Trên tất cả các biến thể dự kiến sẽ tạo ra khoảng 80.000 hàng dữ liệu
Hầu hết thời gian tôi chỉ nhìn vào giá trị của một trong các biến phụ thuộc, tuy nhiên tôi giữ các biến khác xung quanh, vì chúng có thể giải thích những gì đang xảy ra khi có điều gì đó bất ngờ xảy ra.
Trong phiên bản trước của thử nghiệm này, chỉ khác nhau giữa 2 tham số (mỗi giá trị chỉ có 2 giá trị) Tôi đã sao chép csv
tệp này vào chương trình bảng tính và thực hiện một loạt các bản sao dán để tạo một bảng chỉ có biến phụ thuộc mà tôi quan tâm Việc thực hiện một số điều khó xử trong MS-Excel để cho phép tôi sắp xếp theo công thức. Điều này đã đủ đau đớn cho 6 bộ kết quả thí nghiệm mà tôi có. Khi chạy xong, tôi sẽ có thêm 2 đơn hàng kết quả.
Câu hỏi:
Tôi đã suy nghĩ một lần, tôi có thể kết xuất tất cả các kết quả từ các csv
tệp vào cơ sở dữ liệu và truy vấn các phần thú vị. Sau đó lấy những kết quả đó và đưa chúng vào một bảng tính để phân tích. Tạo biểu đồ, tìm điểm được ghi tương đối với kết quả kiểm soát, v.v.
Tôi đang suy nghĩ theo đúng dòng? (Đây có phải là những gì mọi người làm?)
Cơ sở dữ liệu của tôi foo khá hoen rỉ những ngày này, ngay cả khi nó tốt tôi đang sử dụng MS-Access. Tôi cũng có ý định sử dụng MS-Access cho việc này.