Câu trả lời:
Nhiệm vụ thực hiện ghi âm âm thanh liền kề dài và tách nó thành nhiều phần trong đó chỉ có một người nói - không có bất kỳ kiến thức nào trước về đặc điểm giọng nói của mỗi người nói - được gọi là "Diaration loa". Bạn có thể tìm thấy các liên kết đến mã nghiên cứu trên trang wikipedia .
Nếu bạn có bản ghi âm trước của từng giọng nói và muốn phân loại, đây là một vấn đề hơi khác (nhận dạng loa hoặc nhận dạng loa). Các công cụ phần mềm có sẵn ở đây (lưu ý rằng các gói nhận dạng giọng nói cho mục đích chung như Sphinx hoặc HTK đủ linh hoạt để được dỗ dành để thực hiện điều đó).