API Speech của Google có khả năng nói âm thanh thành khả năng văn bản bằng nhiều ngôn ngữ. Nó cũng hỗ trợ tiếng Thổ Nhĩ Kỳ. Ngôn ngữ đó rất thú vị, nó được gọi là agglutinative : bạn dán từng phần từ thay vì giới từ và các phần khác trong các ngôn ngữ như tiếng Anh. Điều này dẫn đến khá nhiều từ vựng kích thước không giới hạn.
Bạn có biết Google đã triển khai nhận dạng giọng nói tiếng Thổ Nhĩ Kỳ cho API của họ như thế nào không? Tôi không thể tin rằng họ đã sử dụng các kỹ thuật tương tự như trong tiếng Anh.
CẬP NHẬT
Dưới đây là bản sao ví dụ mà Google API đã trả về từ clip sau trên YouTube:
bạn sẽ phải hỏi anh ấy Tôi không có câu trả lời nào của Yahoo Tôi là Adam Scott thực sự trong Jumanji trong The Truman Show Tôi đã tra cứu anh ấy trên iTunes. tin rằng nó sẽ nghe Tôi không tham gia một trong những bộ phim đó nên vâng, bạn thực sự không nên * * * *
Tôi nghĩ đó là chất lượng tuyệt vời của phiên âm. Tôi đã sử dụng màn hình AudioEngine tuyệt đẹp của mình và đặt mic máy tính LabTec 20 năm tuổi tẻ nhạt trước nó. Một thiết lập thực sự nghiệp dư, nhưng đó là cách những thứ này sẽ được sử dụng trong thực tế, tức là trong tình huống ít hơn lý tưởng.
Đây là một ví dụ từ một cảnh phim Thổ Nhĩ Kỳ :
bây giờ tôi
Điều này về cơ bản là không thể hiểu được. Nó chọn một số từ ở đây và ở đó, nhưng thật khó để kết nối chúng không giống như trong ví dụ tiếng Anh.
Điều này có nghĩa là Google không sử dụng giải pháp tùy chỉnh cho tiếng Thổ Nhĩ Kỳ? Có lẽ họ muốn tái sử dụng các công cụ ngôn ngữ tiếng Anh của họ cho tiếng Thổ Nhĩ Kỳ?
Để cho vui, tôi đã gửi một clip từ người nói ngôn ngữ Azeri . Bài phát biểu của anh ấy được phát âm rõ ràng nhưng API hầu như không có một vài từ. Tôi đã sử dụng cài đặt tiếng Thổ Nhĩ Kỳ, vì vậy nó không công bằng, thực sự, nhưng các ngôn ngữ tương tự nhau:
o akşam ağlayan Doruk Sevgilin kim bu kim baktı Bülent Serttaş çok pis