Nhận dạng giọng nói đơn giản trong linux


15

Bất cứ ai cũng có một hướng dẫn đơn giản để chạy nhận dạng giọng nói trong linux? Tôi thấy rằng Pocketphinx có sẵn dưới dạng tải xuống nhị phân trong trung tâm phần mềm, nhưng chạy nó từ thiết bị đầu cuối không báo cáo rằng nó cần tham số, nhưng tôi không biết phải đặt gì ở đó. Tôi đã thử cài đặt tất cả các mô hình giọng nói được liệt kê, nhưng tôi không biết chúng được lưu ở đâu hoặc làm thế nào để chúng hoạt động. Tôi cũng không chắc phải làm gì để Sphinx3 hoạt động. Các trang web Sphinx3 dường như bị hỏng và một trang web củaphinphinx không có cách sử dụng ví dụ nào hợp lý với tôi.

Tôi đang tìm kiếm thứ gì đó được nhận dạng đúng 60% từ đầu vào micrô với vốn từ và từ hạn chế, sau đó có thể viết nó vào tệp văn bản - nội dung này tồn tại vào cuối những năm 1980. Vì vậy, tôi biết nó tồn tại và nên hoạt động bằng cách nào đó.

Cảm ơn.

(Kết nối Internet PS không hoạt động)


Tôi đã gặp sự cố khi simon-listens.org chạy trên Ubuntu lần trước tôi đã thử, nhưng cách đây khá lâu, có thể đáng để điều tra
david.libremone

1
Bạn có thể muốn quy định xem yêu cầu kết nối internet hoạt động có ổn không. Dịch vụ thoại google chấp nhận tệp âm thanh và trả về văn bản, nhưng nó không có khả năng ngoại tuyến.
RobotHumans

Internet hoạt động là không có.
2068060

1
Cách tốt nhất để thêm thông tin bổ sung vào câu hỏi của bạn là chỉnh sửa nó, bằng nút chỉnh sửa . Có thể thấy rõ hơn theo cách đó, và ý kiến ​​chủ yếu cho mục đích thứ yếu, tạm thời. Bình luận được loại bỏ trong một loạt các trường hợp. Bất cứ điều gì quan trọng đối với câu hỏi của bạn nên có trong chính câu hỏi.
guntbert

Câu trả lời:


4

Hãy thử Simon Nghe

Simon là một chương trình nhận dạng giọng nói nguồn mở và thay thế chuột và bàn phím. Nó được thiết kế rất linh hoạt và cho phép tùy chỉnh cho bất kỳ ứng dụng nào cần nhận dạng giọng nói.

Để tải về và biết thêm thông tin, hãy truy cập simon trên kde.org



0

Tỷ lệ chính xác phụ thuộc vào nhiều yếu tố như giọng nói, tiếng ồn nền, chất lượng ghi âm. Các mô hình được đào tạo trước có một chút hạn chế và được sử dụng Transcripear thay vì một công cụ chuyển lời nói thành văn bản dựa trên trình duyệt web trong Linux cho các dự án sao chép của tôi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.