Bạn có thể sử dụng một phương thức như eigenfaces, http://en.wikipedia.org/wiki/Eigenface . Sau đây có một hướng dẫn tốt về thủ tục cũng như các liên kết đến các triển khai khác nhau.
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htmlm
Từ đây, người ta thường sử dụng điều này trong cách tiếp cận phân loại, huấn luyện một mô hình và sau đó dự đoán các trường hợp. Bạn có thể làm điều này bằng cách đào tạo một nhóm những người nổi tiếng đã biết và nếu bạn dự đoán một khuôn mặt từ twitter là một trong những người nổi tiếng được đào tạo của bạn, hãy loại bỏ nó. Tương tự như thế này http://blog.cordiner.net/2010/12/02/eigenfaces-face-recognition-matlab/
Điều này bị sửa đổi liên tục. Sẽ sớm có một Justin Bieber mới sẽ không có trong mô hình được đào tạo của bạn, vì vậy bạn không thể dự đoán nó. Cũng có một trường hợp như Whitney Houston, bạn có thể chưa bao giờ nghĩ sẽ thêm cô ấy trước đây nhưng cô ấy có thể là một hình ảnh phổ biến vì sự tôn trọng và ngưỡng mộ trong vài tuần. Bạn sẽ không có nhược điểm của hình ảnh em bé như đã đề cập ở trên. Để khắc phục những vấn đề này, bạn có thể sử dụng nhiều hơn một phương pháp phân cụm theo cấp bậc. Loại bỏ một vài nhóm đầu tiên rất gần nếu chúng đạt đến một mức hỗ trợ nhất định, cụm đầu tiên của bạn có 15 mục trước khi một giây được tạo. Bây giờ bạn không phải lo lắng về ai trong mô hình đào tạo của bạn nhưng bạn sẽ rơi vào vấn đề hình ảnh em bé.