Hành vi phân loại cụ thể sẽ phụ thuộc vào hình thức mô hình cụ thể theo phương pháp phân loại. Đáp ứng chính xác của một mô hình cho các lớp đối tượng bổ sung có thể được suy ra bằng toán học trong các trường hợp cụ thể, mặc dù điều này có thể phức tạp. Vì bạn chưa đưa ra chi tiết về một phương thức cụ thể, tôi sẽ giả định rằng bạn quan tâm nhiều hơn đến phản ứng chung của các mô hình phân loại để thêm hoặc xóa các lớp đối tượng. Để trả lời điều này, tôi sẽ cung cấp một lời giải thích trực quan về những gì bạn nên mong đợi trong một mô hình hợp lý của loại tình huống này. Trong phạm vi mà mô hình khởi hành từ kết quả trực quan này, trong điều kiện rộng, tôi coi đó là một thiếu sót. Do đó, tôi coi các phản ứng sau đây là một desideratum cho một hệ thống dự đoán đối tượng.
Dự đoán trong một mô hình với các lớp đối tượng tùy ý: Để giúp phân tích vấn đề này, giả sử bạn cóN hình ảnh của các biển báo đường phố (hoặc bất cứ thứ gì khác) mà mỗi cái là một mcác loại. Không mất tính tổng quát, hãy đểθ1, . . . ,θN∈ M≡ { 1 , 2 , . . . , m }là loại thực sự của các đối tượng mà bạn đang cố gắng phân loại, vớiMlà các loại đối tượng thực sự. Giả sử bạn áp đặt một hệ thống phát hiện phân loại từng hình ảnh thành các loại trong tập hữu hạnS⊂ N, nơi chúng tôi lưu ý rằng S có thể bao gồm các nhãn trong M, nhưng nó cũng có thể bao gồm các giá trị không có trong bộ này (nghĩa là có thể hệ thống phát hiện của bạn có thể đang cố gắng tìm các loại đối tượng không có ở đó).
Một hệ thống phát hiện loại này xem xét dữ liệu hình ảnh từ mỗi hình ảnh và sử dụng dữ liệu này để phân loại từng hình ảnh thành một loại ước tính, dựa trên các loại cho phép trong mô hình. Nói chung, điều này có thể được mô tả bởi các thành phần sau:
Dữ liệux1, . . . ,xNCác kiểu mẫuSƯớc tínhθ^1, . . . ,θ^N∈ S
Xác suất phân loại hình ảnh chính xác Tôi cho một mô hình với các loại S Là:
pTôi( S) ≡ P (θ^Tôi= =θTôi| x , S) = =Σs ∈ M ∩ S P (θ^Tôi= s | x , S) Tôi (θTôi= s ) .
Các yếu tố của tổng kết sau phải tuân theo ràng buộc xác suất:
Σs ∈ M ∩ S P (θ^Tôi= s | x , S) = 1.
Bây giờ, rõ ràng nếu θTôi∉ S sau đó chúng tôi có pTôi( S) = 0, vì loại đối tượng thực sự không được bao gồm trong mô hình. Do đó, nếu có các yếu tố củaM không có trong S, điều này sẽ dẫn đến việc không thể xác định chính xác các loại phần tử bị thiếu này. Mặt khác, nếu chúng ta loại trừ một yếu tố khỏi tập hợpSsau đó, ceteris paribus , điều này sẽ tăng xác suất dự đoán của các loại đối tượng còn lại, vì xác suất dự đoán phải tổng hợp thành một. Do đó, việc loại trừ một loại đối tượng sẽ có xu hướng nâng cao xác suất dự đoán cho các loại đối tượng khác, điều này làm tăng xác suất dự đoán chính xác cho các loại đối tượng thực sự nằm trongS.
Phân tích chi tiết hơn sẽ cần thiết lập kết nối giữa dữ liệu xvà các dự đoán đối tượng. Chúng tôi sẽ không đi vào chi tiết về chủ đề đó ở đây, vì mô hình cụ thể là không xác định. Tuy nhiên, chúng ta có thể coi nó như một đặc tính chung của các mô hình dự đoán rằng chúng sẽ có xu hướng khó khăn hơn trong việc phân biệt các loại đối tượng trông giống nhau và sẽ có xu hướng ít khác biệt hơn so với các loại đối tượng trông giống nhau . Do đó, loại trừ một loại đối tượng khỏi tập hợpS sẽ có xu hướng tăng xác suất dự đoán các loại đối tượng khác trong tập hợp này trông giống với đối tượng bị loại trừ này, trong trường hợp dữ liệu có lợi cho một trong các loại này.
Giải trình trên được thiết kế để đưa ra một số hướng dẫn chung, nhấn mạnh ràng buộc xác suất trong dự đoán và cách điều này tác động đến xác suất dự đoán chính xác. Điều này dẫn đến các nguyên tắc chung sau đây của mô hình phân loại được xây dựng hợp lý. Ceteris paribus , sau đây nên giữ (ít nhất là khoảng):
Nếu một loại đối tượng thực sự bị loại khỏi mô hình phân loại, điều này sẽ làm giảm xác suất dự đoán đúng của loại đối tượng đó về 0, nhưng nó sẽ có xu hướng tăng xác suất dự đoán đúng cho các loại đối tượng khác (đặc biệt là các loại đối tượng trông như thế này loại trừ);
Nếu một loại đối tượng thực sự được thêm vào mô hình phân loại, điều này sẽ cho phép mô hình có xác suất dự đoán chính xác của loại đối tượng đó, nhưng nó sẽ có xu hướng giảm xác suất dự đoán đúng cho các loại đối tượng khác (đặc biệt là đối tượng loại trông giống như loại được thêm vào);
Nếu một loại đối tượng sai được loại trừ khỏi mô hình phân loại, điều này sẽ có xu hướng tăng xác suất dự đoán đúng cho tất cả các loại đối tượng thực (đặc biệt là các loại đối tượng trông giống như loại bị loại trừ này); và
Nếu một loại đối tượng sai được thêm vào mô hình phân loại, điều này sẽ có xu hướng giảm xác suất dự đoán đúng cho tất cả các loại đối tượng thực (đặc biệt là các loại đối tượng trông giống như loại được thêm vào).
Những nguyên tắc chung này có thể có một số ngoại lệ bệnh lý trong các mô hình cụ thể, trong trường hợp có đa cộng tuyến phức tạp giữa các hình ảnh. Tuy nhiên, họ nên giữ các quy tắc chung sẽ xuất hiện trong các mô hình hoạt động tốt trong các điều kiện rộng.