Điều khiển giọng nói trên môi trường máy tính để bàn


16

Tôi muốn kích hoạt một hệ thống có thể đáp ứng các lệnh thoại của người dùng và chạy các tập lệnh theo lệnh bằng lời nói GIVEN.

Lý tưởng nhất, tôi muốn cho máy tính nghe liên tục.

Khi nghe thấy từ buzz "Máy tính", nó sẽ kích hoạt và nghe lệnh trong 10 giây (hoặc hơn).

Khi đã hoạt động và trong khi nghe, tôi muốn có một bộ từ buzz khác để có thể chạy các tập lệnh.

Ví dụ....

. Có thể có một cho trình duyệt, một cho đóng cửa sổ và hiển thị máy tính để bàn hoặc một loạt các công cụ thực sự.

Điều này thậm chí có thể?

Câu trả lời:


7

Điều khiển bằng giọng nói

Được phát triển như một phần của Google Summer of Code 2007, đây là ý tưởng để phát triển một số tính năng sẽ cải thiện khả năng sử dụng trong Bàn làm việc Gnome.

Mục tiêu là để thực hiện một hệ thống điều khiển bằng giọng nói trên máy tính để bàn. Hệ thống bao gồm một ứng dụng sẽ giám sát đầu vào âm thanh (micrô) và khi phát hiện thấy tín hiệu âm thanh quan trọng, phần mềm sẽ bắt, xử lý và nhận ra tín hiệu và sau đó thực hiện hành động mong muốn trên Bàn làm việc Gnome. Trong một tập hợp các hành động có thể bao gồm tối đa hóa, thu nhỏ, đóng cửa sổ hoạt động; mở một chương trình cụ thể; chuyển đổi từ máy tính để bàn này sang máy tính khác; trong số những người khác. GnomeVoiceControl được triển khai trong C kết hợp với CMU Sphinx, một công cụ nguồn mở, được tạo để chuyển đổi lời nói thành văn bản.

Trình chiếu của các tác giả

Thật không may, có vẻ như nó đã không phát triển vượt quá các "mục tiêu" cơ bản - tuy nhiên dường như có một số hoạt động bổ sung hỗ trợ cho các ngôn ngữ mới như tiếng Bulgaria và tiếng Thổ Nhĩ Kỳ trong năm nay.

Để cài đặt:

sudo apt-get install gnome-voice-control

Thú mỏ vịt

Có một dự án thú vị gọi là thú mỏ vịt - về cơ bản là một phiên bản linux cho Dragon Natatural Talking chạy trong Wine.

Yêu cầu để nổi tiếng cho ứng dụng này là "nó thậm chí có thể khởi chạy các chương trình và tập lệnh của Windows hoặc Linux, ví dụ:" start terminal ".

VEDICS

Đây là một dự án mới cho biết nó hoạt động với giao diện Unity.

Trang dự án cho biết nó nhận ra "chạy [tên chương trình]" - vì vậy về mặt lý thuyết, [tên chương trình] có thể là bất kỳ tập lệnh nào bạn muốn chạy.


Cảm ơn bạn đã phản hồi đặc biệt nhanh chóng. Tôi đã nghe về chương trình đó và tôi đã cài đặt nó, nhưng dường như nó không nhận được cấu hình trong quá khứ - nó chỉ nói "config". Tôi ngạc nhiên vì đã không có nhiều công việc được thực hiện trên mặt trận này. Có lẽ có một cửa sổ tương đương mà tôi có thể chạy với rượu vang?
BorgDomination

1
phiên bản cũ hơn của giọng nói gnome trong synap cho tôi kết quả tương tự. Tôi đã thử mới nhất từ ​​trang web và nó dường như tiến xa hơn nhưng tôi chưa bao giờ làm cho nó hoạt động đúng. các phụ thuộc thủ công là một nỗi đau.
Kendrick

3

Simon lắng nghe

Đây là một dự án nguồn mở nhằm thay thế chuột và / hoặc bàn phím bằng nhận dạng giọng nói ban đầu được phát triển cho người khuyết tật.

Có một ppa từ đó chúng ta có thể cài đặt ứng dụng: ppa: grasch-simon-listens / simon


simon chỉ làm việc với kde? Nó trông thực sự tuyệt vời và tôi đã cài đặt nó nhưng dường như không thể làm cho nó hoạt động với gnome-shell. quản lý cửa sổ đặc biệt. Nếu tôi muốn hiển thị tất cả các cửa sổ chẳng hạn, điều đó sẽ hoạt động khác nhau trong kde env và gnome env phải không?
Joshua Robison

1
Các phụ thuộc phải được giải quyết khi cài đặt trên Ubuntu <= 12.04 từ ppa nhưng tôi chưa thử gần đây và tôi cũng không biết làm thế nào nó có thể can thiệp vào vỏ Gnome. Không có phiên bản (chưa) cho 12.10.
Takkat

3

Google2Ubfox

Google2Ubfox là một công cụ cho phép bạn điều khiển máy tính của mình bằng lệnh thoại thông qua API nhận dạng giọng nói của Google.

Chạy các lệnh dưới đây trên thiết bị đầu cuối để cài đặt google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Nguồn


1

Nhận dạng giọng nói Linux

Nó đang được phát triển để chạy theo các bản phân phối Linux, nó rất dễ cấu hình và dễ mở rộng, hỗ trợ từ điển tùy chỉnh, nhận dạng dựa trên ngữ cảnh, chế độ đọc chính tả và macro có thể định cấu hình.

Để cài đặt Linux Speech Recognition, hãy truy cập trang GitHub của dự án . Tải về tập tin ZIP và giải nén nó.

Sau đó cài đặt một số phụ thuộc:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Mở thư mục giải nén (Palaver-master) trong thiết bị đầu cuối và thực hiện thiết lập:

cd /~Path-to-folder~/Palaver-master/
./setup

Giờ đây, chỉ cần gán một phím nóng để bật ghi âm, để thực hiện việc đó, hãy vào Cài đặt hệ thống ...> Bàn phím> Phím tắt> Phím tắt tùy chỉnh, nhấp vào nút Plus để thêm phím tắt, đặt tên là Nhận dạng giọng nói và đặt lệnh thành:

/~Path-to-folder~/Palaver-master/hotkey

Nhấp vào áp dụng, nhấp qua phím tắt và sau đó gán một phím nóng để kích hoạt Nhận dạng giọng nói.

Lưu ý rằng chưa có bản dựng ổn định nào được phát hành, vì vậy đừng hy vọng các lệnh sẽ hoạt động đầy đủ ở giai đoạn này, nhiều cụm từ sẽ được nhận ra, nhưng sẽ không có hành động thực sự nào được thực hiện.


Đến bây giờ,
Palaver

0

Snips.ai

Chỉ cần thử nó trên pi3 - dường như có tiềm năng
Chạy trong docker

https://snips.ai/


1
Chào mừng bạn đến hỏi Ubuntu. Xin lưu ý rằng nếu bạn được liên kết với công cụ này, bạn cần nói rõ ràng như vậy trong bài đăng của mình; xem Làm thế nào để không trở thành một người gửi thư rác .
Glorfindel

1
Trang web chính thức cho biết: Nguồn mở: Chúng tôi cam kết mở Snips theo thời gian , vì vậy Snips có thể đáng để thử.
karel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.