Nhật ký: Phương pháp học máy


7

Trước đây, khi thử các thuật toán học máy khác nhau để giải quyết vấn đề, tôi thường viết các phương pháp tiếp cận trên máy tính xách tay, giữ các chi tiết như tính năng, tiền xử lý, chuẩn hóa, thuật toán, tham số thuật toán ... do đó, xây dựng nhật ký viết tay.

Tuy nhiên, hiện tại tôi lo ngại về việc sử dụng công cụ 'chuyên nghiệp hơn', để tôi có thể giữ nhiều chi tiết hơn và thậm chí chia sẻ nó với các thành viên khác trong nhóm, những người cũng có thể đóng dấu các phương pháp của họ.

Nó sẽ là một công cụ tự động và hợp tác tuyệt vời để theo dõi công việc được thực hiện, xem xét các chi tiết như: tính năng, thuật toán, tham số thuật toán, tiền xử lý dữ liệu, dữ liệu, số liệu ... ngoài bảng tính Google Drive hợp tác.

Làm thế nào bạn giải quyết điều này? Làm thế nào bạn theo dõi các công việc được thực hiện? Công cụ nhật ký của bạn là gì?

Cảm ơn bạn rất nhiều trước.

Câu trả lời:


4

Làm thế nào bạn giải quyết điều này? Làm thế nào bạn theo dõi các công việc được thực hiện? Công cụ nhật ký của bạn là gì?

Đây có thể không phải là cách tiếp cận tốt nhất. Nhưng, đây là cách nhóm của tôi làm điều đó. Chúng tôi tin rằng để thực hiện một thí nghiệm khoa học dữ liệu đầu cuối, lương tâm đúng đắn là rất quan trọng. Vì vậy, chúng tôi sử dụng Slack cho cùng cho các cuộc thảo luận của chúng tôi và các cuộc họp.

Ngoài chúng, chúng tôi có các tệp Rmd ​​(R markdown) để ghi lại kế hoạch và các phần phân tích.


1
Tôi thích ý tưởng sử dụng markdown, tuy nhiên, tôi đoán đó không phải là cách tiếp cận / giải pháp tốt nhất. Nó tốt cho một điểm khởi đầu. Tôi cũng sử dụng Slack, và tôi đánh giá cao nó cho các cuộc họp và phối hợp nhóm.
Jorge

@Jorge Vâng, tôi đồng ý rằng đó không phải là cách tiếp cận tốt nhất :) Tuy nhiên, tôi chưa tìm thấy một sự thay thế tốt đáng để chi tiêu!
Dawny33

3

Hãy xem cái này, giống như chính xác những gì bạn cần http://www.openml.org


Đây có phải là sản phẩm của Google không? Giao diện người dùng trông rất giống google
Dawny33

1
Tôi không biết. Tôi không liên kết với trang web đó theo bất kỳ cách nào. Họ có chủ sở hữu và thông tin hoster được liệt kê trên trang đầu mặc dù.
Diego

2

Làm thế nào bạn giải quyết điều này? Làm thế nào bạn theo dõi các công việc được thực hiện? Công cụ nhật ký của bạn là gì?

Đối với luận án cử nhân của tôi ( write-math.com ) Tôi đã viết bộ công cụ nhỏ của riêng mình để thực hiện các mô hình / bước tiền xử lý khác nhau rất nhanh. Mỗi thử nghiệm có một tệp cấu hình (xem kho lưu trữ thử nghiệm hwr ). Ví dụ:

data-source: feature-files/baseline-3-points
training: '{{nntoolkit}} train --epochs 1000 --learning-rate 0.1 --momentum 0.1 --print-errors --hook=''!detl
    test {{testing}},err=testresult_%e.txt'' {{training}} {{validation}}
    {{testing}} < {{src_model}} > {{target_model}} 2>> {{target_model}}.log'
model:
    type: mlp
    topology: 24:500:369

Các mô hình đào tạo được lưu trữ; khá nhanh để có được kết quả đánh giá (ví dụ: độ chính xác, ma trận nhiễu).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.