Thuộc tính để xây dựng một mạng lưới thần kinh đa lớp Perceptron bằng cách sử dụng máy ảnh?


8

Tôi đang cố gắng xây dựng và huấn luyện một mạng lưới thần kinh perceptron đa lớp để dự đoán chính xác lần đầu tiên tổng thống giành được gì ở quận nào. Tôi có các thông tin sau đây cho dữ liệu đào tạo.

Tổng dân số Tuổi trung bình% Cử nhân Tỷ lệ thất nghiệp hoặc cao hơn Tỷ lệ thất nghiệp Thu nhập bình quân đầu người Tổng hộ gia đình Quy mô hộ gia đình trung bình% Chủ sở hữu nhà ở% Người thuê nhà% Nhà ở trung bình Giá trị nhà trung bình Tăng trưởng dân số Tăng trưởng thu nhập bình quân đầu người

Đó là 14 cột dữ liệu đào tạo và cột thứ 15 là đầu ra phải là gì.

Tôi đang cố gắng sử dụng Keras để xây dựng một mạng lưới thần kinh perceptron đa lớp, nhưng tôi cần một số trợ giúp để hiểu một số thuộc tính và ưu điểm của việc chọn các tùy chọn khác nhau cho các thuộc tính này.

  1. CHỨC NĂNG HOẠT ĐỘNG

Tôi biết bước đầu tiên của tôi là đưa ra một chức năng kích hoạt. Tôi luôn nghiên cứu các mạng thần kinh sử dụng các chức năng kích hoạt sigmoid. Là một chức năng kích hoạt sigmoid là tốt nhất? Làm thế nào để bạn biết cái nào để sử dụng? Ngoài ra, Keras còn cung cấp các tùy chọn sử dụng chức năng kích hoạt softmax, softplus, relu, tanh, tuyến tính hoặc hard_sigmoid. Tôi ổn với việc sử dụng bất cứ điều gì, nhưng tôi chỉ muốn có thể hiểu tại sao và những ưu và nhược điểm.

  1. KHỞI TẠO KHẢ NĂNG

Tôi biết các khởi tạo xác định phân phối xác suất được sử dụng để đặt các trọng số ngẫu nhiên ban đầu của các lớp Keras. Các tùy chọn mà Keras cung cấp là lecun_uniform đồng nhất, bình thường, nhận dạng, trực giao, zero, glorot_n normal, glorot_uniform, he_n normal và he_uniform. Làm thế nào để lựa chọn của tôi ở đây ảnh hưởng đến kết quả hoặc mô hình cuối cùng của tôi? Không phải là không quan trọng bởi vì chúng tôi đang "đào tạo" bất kỳ mô hình ngẫu nhiên nào chúng tôi bắt đầu và đưa ra một trọng số tối ưu hơn của các lớp dù sao?

Câu trả lời:


6

1) Kích hoạt là một lựa chọn kiến ​​trúc, có thể lựa chọn siêu tham số. Bạn có thể đưa ra một đối số lý thuyết cho việc sử dụng bất kỳ chức năng nào, nhưng cách tốt nhất để xác định điều này là thử một vài và đánh giá trên một bộ xác nhận. Điều quan trọng cần nhớ là bạn có thể trộn và kết hợp các kích hoạt của các lớp khác nhau.

2) Về lý thuyết là có, nhiều khởi tạo ngẫu nhiên sẽ giống nhau nếu dữ liệu của bạn hoạt động rất tốt và lý tưởng mạng của bạn. Nhưng trong thực tế, việc khởi tạo tìm cách đảm bảo độ dốc bắt đầu hợp lý và tín hiệu có thể được truyền ngược lại một cách chính xác. Có thể trong trường hợp này, bất kỳ khởi tạo nào cũng sẽ thực hiện tương tự, nhưng cách tiếp cận tốt nhất là thử chúng, chuyển đổi nếu bạn nhận được kết quả không mong muốn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.