Tôi đang cố gắng xây dựng và huấn luyện một mạng lưới thần kinh perceptron đa lớp để dự đoán chính xác lần đầu tiên tổng thống giành được gì ở quận nào. Tôi có các thông tin sau đây cho dữ liệu đào tạo.
Tổng dân số Tuổi trung bình% Cử nhân Tỷ lệ thất nghiệp hoặc cao hơn Tỷ lệ thất nghiệp Thu nhập bình quân đầu người Tổng hộ gia đình Quy mô hộ gia đình trung bình% Chủ sở hữu nhà ở% Người thuê nhà% Nhà ở trung bình Giá trị nhà trung bình Tăng trưởng dân số Tăng trưởng thu nhập bình quân đầu người
Đó là 14 cột dữ liệu đào tạo và cột thứ 15 là đầu ra phải là gì.
Tôi đang cố gắng sử dụng Keras để xây dựng một mạng lưới thần kinh perceptron đa lớp, nhưng tôi cần một số trợ giúp để hiểu một số thuộc tính và ưu điểm của việc chọn các tùy chọn khác nhau cho các thuộc tính này.
- CHỨC NĂNG HOẠT ĐỘNG
Tôi biết bước đầu tiên của tôi là đưa ra một chức năng kích hoạt. Tôi luôn nghiên cứu các mạng thần kinh sử dụng các chức năng kích hoạt sigmoid. Là một chức năng kích hoạt sigmoid là tốt nhất? Làm thế nào để bạn biết cái nào để sử dụng? Ngoài ra, Keras còn cung cấp các tùy chọn sử dụng chức năng kích hoạt softmax, softplus, relu, tanh, tuyến tính hoặc hard_sigmoid. Tôi ổn với việc sử dụng bất cứ điều gì, nhưng tôi chỉ muốn có thể hiểu tại sao và những ưu và nhược điểm.
- KHỞI TẠO KHẢ NĂNG
Tôi biết các khởi tạo xác định phân phối xác suất được sử dụng để đặt các trọng số ngẫu nhiên ban đầu của các lớp Keras. Các tùy chọn mà Keras cung cấp là lecun_uniform đồng nhất, bình thường, nhận dạng, trực giao, zero, glorot_n normal, glorot_uniform, he_n normal và he_uniform. Làm thế nào để lựa chọn của tôi ở đây ảnh hưởng đến kết quả hoặc mô hình cuối cùng của tôi? Không phải là không quan trọng bởi vì chúng tôi đang "đào tạo" bất kỳ mô hình ngẫu nhiên nào chúng tôi bắt đầu và đưa ra một trọng số tối ưu hơn của các lớp dù sao?