Những công cụ nào được sử dụng để đối phó với vấn đề ví dụ đối nghịch?


9

Vấn đề của các ví dụ đối nghịch được biết là rất quan trọng đối với các mạng lưới thần kinh. Ví dụ, một bộ phân loại hình ảnh có thể được xử lý bằng cách cộng gộp một hình ảnh có biên độ thấp khác nhau cho mỗi ví dụ đào tạo trông giống như nhiễu nhưng được thiết kế để tạo ra các phân loại sai cụ thể.

nhập mô tả hình ảnh ở đây

Vì các mạng lưới thần kinh được áp dụng cho một số vấn đề nghiêm trọng về an toàn (ví dụ: ô tô tự lái), tôi có câu hỏi sau đây

Những công cụ nào được sử dụng để đảm bảo các ứng dụng quan trọng về an toàn có khả năng chống lại việc tiêm các ví dụ bất lợi vào thời gian huấn luyện?

Nghiên cứu trong phòng thí nghiệm nhằm phát triển an ninh phòng thủ cho mạng lưới thần kinh tồn tại. Đây là một vài ví dụ.

Tuy nhiên, các chiến lược và phương pháp phòng thủ sẵn sàng cho sức mạnh công nghiệp, sẵn sàng sản xuất có tồn tại không? Có các ví dụ đã biết về các mạng kháng nghịch lý được áp dụng cho một hoặc nhiều loại cụ thể (ví dụ: đối với các giới hạn nhiễu loạn nhỏ) không?

Đã có (ít nhất) hai câu hỏi liên quan đến vấn đề hackđánh lừa mạng lưới thần kinh. Tuy nhiên, mối quan tâm chính của câu hỏi này là liệu có công cụ nào tồn tại có thể bảo vệ chống lại một số cuộc tấn công ví dụ đối nghịch hay không.


Douglas thân mến, tôi xin lỗi nếu tôi nói điều gì đó thô lỗ hoặc như thế. Tôi không có gì chống lại câu trả lời của bạn. Sẽ thật tuyệt nếu bạn khôi phục câu trả lời. Nó đủ tốt, theo một nghĩa nào đó, nhưng tôi chỉ nghĩ rằng nó có thể còn tốt hơn nữa. Tôi tôn trọng quan điểm của bạn, và chỉ muốn hiểu nó nhiều hơn. Có thể các ghi chú của tôi dường như quá quan trọng, nhưng tôi chỉ muốn thêm bất kỳ liên kết nào hỗ trợ ý kiến ​​của bạn: khảo sát, blog, giấy tờ, v.v ... Rõ ràng là ai đó đã xuất bản những ý tưởng này, nếu chúng thực sự phù hợp với tình hình hiện tại của điều này khu vực nghiên cứu.
Ilya Palachev

1
Tôi đã đăng ký Google.Scholar vào các bài báo liên quan đến lĩnh vực nghiên cứu này và hầu như mỗi tuần tôi nhận được các bài báo mới được xuất bản về chủ đề này trên arXiv hoặc một cái gì đó khác. Đây là lý do tại sao tôi nói rằng văn học không mỏng.
Ilya Palachev

Câu trả lời:


3

Tuy nhiên, liệu sức mạnh công nghiệp, chiến lược phòng thủ sẵn sàng sản xuất có tồn tại? Có các ví dụ đã biết về các mạng kháng nghịch lý được áp dụng cho một hoặc nhiều loại cụ thể (ví dụ: đối với các giới hạn nhiễu loạn nhỏ) không?

Tôi nghĩ thật khó để biết liệu có bất kỳ sự bảo vệ sức mạnh công nghiệp nào ngoài đó hay không (mà tôi cho rằng điều đó có nghĩa là chúng đáng tin cậy chống lại tất cả hoặc các phương thức tấn công đã biết nhất). Adversarial Machine Learning thực sự là một lĩnh vực nghiên cứu rất tích cực và đang phát triển . Không chỉ là những cách tiếp cận mới để bảo vệ được xuất bản khá thường xuyên, mà còn có những nghiên cứu tích cực về các cách tiếp cận khác nhau để "tấn công". Với các phương thức tấn công mới được phát hiện thường xuyên, không ai có thể tuyên bố rằng họ có những cách tiếp cận đáng tin cậy để chống lại tất cả.

Tuy nhiên, mối quan tâm chính của câu hỏi này là liệu có công cụ nào tồn tại có thể bảo vệ chống lại một số cuộc tấn công ví dụ đối nghịch hay không.

Thứ gần nhất với "công cụ" sẵn sàng sử dụng mà tôi có thể tìm thấy là Hộp công cụ chống bạo lực của IBM , dường như có nhiều phương thức tấn công và phòng thủ được triển khai. Nó dường như là trong sự phát triển tích cực, đó là điều tự nhiên khi xem xét lĩnh vực nghiên cứu cũng rất tích cực. Tôi chưa bao giờ thử sử dụng nó, vì vậy tôi không thể chứng minh cá nhân về mức độ dễ sử dụng như một công cụ cho ngành công nghiệp, hoặc nếu nó thực sự chỉ phù hợp cho nghiên cứu.


Dựa trên ý kiến ​​của Ilya , các khung công tác khác có thể hữu ích để xem xét là CleverhansFoolbox .


1
Tôi muốn thêm CleverHansFoolbox , những đối thủ cạnh tranh của hộp công cụ Robustness IBM Adversarial Robustness. Bạn có biết làm thế nào ba giải pháp có thể được so sánh?
Ilya Palachev

@IlyaPalachev Từ cái nhìn nhanh qua các mô tả của họ, tôi có cảm tưởng rằng các kho lưu trữ đó chỉ chứa các phương thức tấn công, không phải phương thức phòng thủ. Tôi không đủ quen thuộc với họ để nói chắc chắn nếu điều đó đúng, đó chỉ là ấn tượng tôi có. Rõ ràng, các kho lưu trữ như vậy vẫn sẽ được sử dụng cho các phương pháp phòng thủ điểm chuẩn, vì vậy việc tìm kiếm các địa điểm trích dẫn việc sử dụng các kho lưu trữ này có thể dẫn đến các phương pháp phòng thủ thú vị.
Dennis Soemers

1
Các anh chàng của CleverHans hiện đang thực hiện khung phụ quốc phòng. Trong cuộc khảo sát gần đây về lĩnh vực này, họ cũng tuyên bố rằng CleverHans có chứa "các triển khai tham chiếu của một số thủ tục tấn công và phòng thủ" (trang 85).
Ilya Palachev

1
@IlyaPalachev À tôi hiểu rồi. Để hoàn thiện, tôi đã chỉnh sửa chúng thành câu trả lời của mình, nơi chúng có thể dễ nhìn thấy hơn đối với khách truy cập của trang web trong tương lai so với các nhận xét.
Dennis Soemers
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.