Một tri giác có thể quên?


16

Tôi muốn xây dựng một hệ thống máy học dựa trên web trực tuyến, nơi người dùng có thể liên tục thêm các mẫu được phân loại và mô hình được cập nhật trực tuyến. Tôi muốn sử dụng một perceptron hoặc một thuật toán học trực tuyến tương tự.

Nhưng, người dùng có thể mắc lỗi và chèn các ví dụ không liên quan. Trong trường hợp đó, tôi muốn có tùy chọn xóa một ví dụ cụ thể, mà không cần đào tạo lại perceptron trên toàn bộ tập hợp các ví dụ (có thể rất lớn).

Điều này có thể không?


ý tưởng rất thú vị. Bạn đã nỗ lực trong việc chính thức hóa điều này?
Strin

Đưa ra các chi tiết cụ thể của mô hình perceptron và bộ phân loại của bạn, điều gì xảy ra khi bạn chèn lại ví dụ với phân loại đã sửa? Điều này không làm giảm trọng lượng của các tế bào thần kinh lớp bên trong sai và tăng trọng lượng trên các tế bào thần kinh lớp bên phải phải không?
Logic lang thang

1
Việc chèn lại mẫu rõ ràng có thể giúp ích theo một cách nào đó, tuy nhiên, tôi không chắc chắn bằng chứng chính xác và hội tụ của perceptron sẽ giữ trong trường hợp này (nghĩa là tôi không chắc kết quả sẽ giống hệt với tình huống mẫu bị lỗi không được chèn vào vị trí đầu tiên).
Erel Segal-Halevi

Là một giải pháp ngây thơ, bạn có thể giữ một bản ghi về trọng lượng của tri giác trước khi mỗi mẫu mới được thêm vào. Sau đó, khi bạn muốn loại bỏ một mẫu, (lại) đặt trọng số của perceptron thành giá trị của chúng trước khi ví dụ "xấu" được thêm vào và huấn luyện lại perceptron với tất cả các ví dụ hợp lệ được thêm vào sau ví dụ "xấu". Điều này sẽ liên quan đến một số đào tạo lại, nhưng không phải trên toàn bộ các ví dụ. Tất nhiên, bạn cũng phải duy trì hồ sơ về các ví dụ và trọng lượng liên quan của chúng.
rphv

Câu trả lời:


6

Theo tôi hiểu quá trình , việc thay đổi một tri giác mà không cần đào tạo lại là không thể. Các điều chỉnh trọng lượng không chỉ liên quan đến ví dụ cụ thể đó mà còn liên quan đến các ví dụ đào tạo khác đã đi trước đó. Xác định trường hợp được phân loại không chính xác và loại bỏ nó khỏi bộ kiểm tra trước khi đào tạo lại mô hình dường như là cách hiệu quả nhất để sửa các trọng số.

Tôi nghĩ rằng đáng để chỉ ra rằng so với các thuật toán học máy khác, các tri giác tương đối chống nhiễu và các trường hợp được phân loại không chính xác trong tập huấn luyện . Nếu bạn gặp phải một số lượng lớn các trường hợp được phân loại sai, có vẻ sẽ khôn ngoan hơn khi xác nhận tốt hơn tại thời điểm bạn nhập dữ liệu trước khi đào tạo hơn là đưa ra một số cách để sửa cho các trường hợp được phân loại sai sau khi perceptionron được đào tạo. Nếu điều đó là không thể và bạn có thể xác định các trường hợp được phân loại không chính xác như vậy, thì loại bỏ chúng và đào tạo lại dường như là cách duy nhất để loại bỏ hiệu quả tác động của các trường hợp được phân loại sai.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.