Làm cách nào tôi có thể sử dụng nhận dạng giọng nói được Android sử dụng trên Ubuntu?


16

Nếu tôi đang phát triển một ứng dụng Android sử dụng nhận dạng TTS và Thoại, thư viện nào được sử dụng cho cùng nhận dạng giọng nói và lời nói trên Ubuntu?

Tôi giả sử đặc biệt cho văn bản thành lời nói, nhưng tôi không chắc thư viện nhận dạng giọng nói và hệ thống từ điển / học tập / hiệu chuẩn nào được sử dụng để nhận dạng giọng nói.

Tôi muốn làm cho ứng dụng có sẵn trên Ubuntu Desktop.
cũng như kiểm tra nó bên ngoài một trình giả lập


kiểm tra điều này nhưng mặc dù không có câu trả lời đáng kể nào
devav2

@ devav2 cảm ơn vì những nỗ lực, nhưng không thực sự liên quan. đăng nhập bằng giọng nói và bộ công cụ nhận dạng giọng nói nào được sử dụng trên Android (và nếu nó có sẵn trong Ubuntu) là hai điều hoàn toàn khác nhau.
RobotHumans

Có lẽ bạn sẽ cần tìm hiểu chính xác thư viện nào Android sử dụng ở nơi khác, sau đó quay lại đây và hỏi cách sử dụng chúng trong Ubuntu. Nếu bạn không thể tìm thấy nó trong tài liệu Android , những người đam mê Android hoặc Stack Overflow có thể giúp ích.
ændrük

Không chắc chắn về việc sử dụng nó với Android, nhưng Festival / festivalvox nghe có vẻ ít robot hơn so với đặc biệt. Đối với nhận dạng giọng nói, en.wikipedia.org/wiki/ Từ có thể giúp đỡ.
Adam

Chà, đặc biệt là tiêu chuẩn trên máy tính để bàn Ubuntu bây giờ ... vì vậy không có sự phụ thuộc nào được thêm vào. Mặt khác, các gói trả phí từ cepstral không đắt khủng khiếp và chúng giáp ranh với skeksi.
RobotHumans

Câu trả lời:


5

Bạn có thể sử dụng API webspeech của Google cho ứng dụng của mình. Nó sử dụng công nghệ tương tự như được sử dụng trên Android.


Nếu bạn chỉnh sửa thêm một chút dữ liệu, tôi cũng sẽ chấp nhận điều này
RobotHumans

Thành thật mà nói, tôi chưa có đủ kinh nghiệm với API của họ để cung cấp cho bạn thông tin đó!
ishitor


1
  1. Nhận dạng giọng nói của Android dựa trên kết nối internet, vì máy chủ có cơ sở dữ liệu đáng kể về các mẫu giọng nói. (Tôi nghĩ)

    • Máy tính chưa có khả năng nhận dạng giọng nói rất tốt, vì vậy bạn cần một cơ sở dữ liệu khổng lồ với rất nhiều giọng nói cho máy tính để tham khảo chéo và hiểu từ ngữ tốt hơn. (Ít nhất cuối cùng tôi đã nghiên cứu nó)

    • Vì vậy, bạn không thể sử dụng nó ngoại tuyến.

  2. Tuy nhiên, bạn có thể sử dụng nhận dạng giọng nói để viết thông qua một cách giải quyết

    • Bằng cách tạo kết nối máy tính để bàn / vnc từ xa và trực tiếp

    • hoặc bằng cách sử dụng một ứng dụng bàn phím từ xa.

Chrome có thể sử dụng nhận dạng giọng nói cho các tìm kiếm và với tiện ích mở rộng, có thể được sử dụng để điền vào dữ liệu thực địa. nhưng theo như tôi biết đó là nó

và đó là tất cả những gì tôi biết.


Tôi hiểu rằng nhận dạng giọng nói đòi hỏi phải có một từ để học các từ ngoài ngữ âm và từ điển đơn giản (vì vậy các kết hợp mờ có thể được thực hiện khi bạn không phát âm). Tôi ổn với việc yêu cầu kết nối internet nếu có thể sử dụng được.
RobotHumans

0

Có thể bạn sử dụng CMU Sphinx, nó có thể được sử dụng như một bộ công cụ để phát triển nhận dạng giọng nói cả trong Linux và Android: CMU Sphinx

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.