Câu trả lời:
Theo bài báo So sánh các máy dò tìm khuôn mặt và đầu dựa trên CNN cho các ứng dụng giám sát video thời gian thực Các mạng thần kinh dựa trên CNN tốt hơn đáng kể so với Viola-Jones về độ chính xác nhưng cần nhiều sức mạnh tính toán hơn để tính toán kết quả. Lỗi chính xác trung bình trung bình cho các mạng dựa trên CNN ít hơn 5 lần so với VJ đối với dữ liệu FDDB. Dưới đây là bảng so sánh chính xác từ bài báo:
Nhưng VJ cho phép nhận dạng thời gian thực với 60 khung hình mỗi giây. Đây là so sánh tốc độ từ cùng một bài báo: