Dự án chuyển văn bản thành giọng nói cho cha mẹ mù


12

Bài viết đầu tiên của tôi ở đây. (Tôi chân thành hy vọng nó nằm trong phạm vi bài viết được phép mà tôi không biết nơi nào khác để chuyển).

Tôi dự định thực hiện một dự án cho một bà mẹ chín mươi tuổi đang nhanh chóng mất thị lực và có một cuộc sống tương đối vui vẻ.

Cô ngồi một mình ở nhà xem cáp cơ bản và không có kết nối internet. Cô có một điều khiển từ xa khổng lồ với 60 nút nhỏ và về cơ bản là bối rối.

Tôi chỉ muốn đặt vào đĩa cứng một thư viện phim và / hoặc sách nói để cô ấy có thể điều hướng qua chúng và xem lúc rảnh rỗi.

Tôi đã quyết định cô ấy cần một cần điều khiển đơn giản với 6 nút cấu hình lớn. Tôi sẽ cần tìm ra một số cách mà các tiêu đề có thể được tự động đọc cho cô ấy (khi cô ấy cuộn xuống trước khi lựa chọn).

GUI cung cấp văn bản HUGE trên màn hình có thể đủ ... nhưng tôi tin rằng tính năng chuyển văn bản thành giọng nói có thể là vấn đề khó khăn nhất.

Nếu các tiêu đề được đọc cho cô ấy, GUI gần như là một điểm cần thiết.

XBMC, tôi thấy, có một số tính năng chuyển văn bản thành giọng nói ... mặc dù tôi không thể xác định liệu đó có phải là thứ cần có tầm nhìn của cô ấy để điều hướng qua giao diện để "truy cập" nội dung hay không. (Hơn nữa, tôi không thể xác định liệu menu có được đọc bởi gui hay không - cho phép điều hướng "không nhìn thấy")

Tôi cần một GUI để mở với một danh sách ngay lập tức khi khởi động (thông qua đó cô ấy có thể chỉ cần cuộn và chọn nội dung).

Câu hỏi đơn giản của tôi là liệu có thể với PI hay không và liệu có vẻ như đây là một mục tiêu có thể đạt được.

Nếu không có cơ hội ai đó có thể chỉ cho tôi đi đúng hướng, tôi sẽ đánh giá cao điều đó.

Cảm ơn nhiều.


Bạn đã cố gắng tìm kiếm "bài phát biểu" trên Diễn đàn này. Có một vài liên kết (tôi chưa thực sự thử bất kỳ), ví dụ: raspberrypi.stackexchange.com/questions/1015/
mẹo

Tôi không chắc chắn nếu bạn đã đăng điều này trên các diễn đàn Rapsberry org . Nếu bạn chưa làm như vậy, thì đó là loại câu hỏi được hỏi ở đó một cách hợp lý thường xuyên.
joan

Mặc dù có một thẻ cho "nhận dạng giọng nói" nhưng không có mặt trái của "tạo giọng nói" mà là một chủ đề riêng biệt. Nó là một phần của cái thường được gọi là "chuyển văn bản thành giọng nói" (phần thứ hai) và tất cả những thứ này thường liên quan đến các vấn đề thường được gọi là "khả năng tiếp cận" liên quan đến việc làm cho mọi thứ dễ sử dụng hơn cho cả hai con người có khả năng đầy đủ và cả những người bị suy giảm mức độ nào đó có thể yêu cầu chức năng bổ sung để đạt được kết quả tương tự. Câu trả lời này đã được sử dụng để tạo ra ba thẻ này.
SlySven

3
Tôi yêu ý tưởng của dự án này rất nhiều, tôi vừa đề cử nó cho Ý tưởng dự án Raspberry Pi gốc tốt nhất trong cuộc thi Tặng quà Giáng sinh trên Raspberry Pi Meta.
Phil B.

1
Gửi tới tất cả những người đã đăng bài: Tôi rất cảm động và được khuyến khích bởi phản hồi về điều này. Tôi là người mới và chưa bao giờ nhìn thấy PI bằng chính mắt mình. Tôi rất biết ơn về những phản hồi tốt bụng và đã đổi mới quyết tâm theo đuổi điều này vì chúng. Tôi cũng đã chia sẻ tin tức với mẹ tôi - người nói rằng bà thích bánh táo hơn bánh mâm xôi và thực sự không biết tôi đang nói về điều gì nữa ... nhưng bây giờ điều đó vẫn ổn :).
LeoFib

Câu trả lời:


8

Tôi không chắc chắn làm thế nào để tạo ra gui, nhưng tôi biết làm thế nào để thực hiện văn bản thành giọng nói. Bạn có thể sử dụng đặc biệt:

sudo apt-get install espeak
espeak 'Hello world'

Theo mặc định, giọng nói của Espeak là khó hiểu (đối với tôi). Để tìm giọng nói, hãy sử dụng:

sudo apt-cache search espeak

Sau đó, tìm một giọng nói. Cài đặt nó. Sau đó chạy

man espeak

để tìm cách thay đổi giọng nói. Nó nên đơn giản.

Dưới đây là một ví dụ về một cái gì đó tôi đã thực hiện bằng cách sử dụng đặc biệt: https://github.com/Merlin04/robotthingy

Chỉnh sửa: Tôi nghĩ bạn có thể tạo GUI bằng Kivy. Nó sử dụng trăn.


7

Tôi chỉ có kinh nghiệm hạn chế với XBMC nhưng tin tưởng mạnh mẽ rằng điều đó có thể đã quá phức tạp đối với 'đối tượng mục tiêu' (người phụ nữ 90 tuổi này).

Tuy nhiên, tôi tin rằng dự án này chắc chắn có thể đạt được trên RasPi. Là một nhà phát triển web, tôi sẽ đề xuất xây dựng một ứng dụng web đơn giản. Tôi không có manh mối gì nếu một cái gì đó như thế này tồn tại, nhưng tôi không thể tưởng tượng nó quá khó để phát triển.

Ý kiến ​​cơ bản:

  1. RasPi với Raspbian.
  2. Webapp chạy apache.
  3. Một số phụ trợ (ví dụ PHP) lập chỉ mục các tệp trên đĩa cứng, định dạng tên thành một số định dạng có thể đọc được và xuất chúng dưới dạng danh sách.
  4. Sử dụng javascript để điều khiển đầu vào phím điều khiển và làm cho tiêu đề phim / sách được đọc bằng API Tổng hợp lời nói HTML5 (ví dụ: http://creative-punch.net/2014/10/intro-html5-speech-synt tổng hợp- api / ).
  5. Khi chọn phim / sách, chỉ cần mở tệp trong trình duyệt. (Bằng cách này, bạn sẽ không phải mở một cửa sổ mới để cô ấy có thể quay lại menu bằng cách nhấn nút quay lại.)

OSMC (kodi) trưng bày một số api còn lại. Có lẽ bạn có thể sử dụng điều đó để xây dựng front-end / gui của riêng bạn. Tuy nhiên tôi đồng ý với Rien rằng điều này nghe có vẻ quá phức tạp đối với khán giả của bạn. Tôi không cho rằng một người có thể ở gần để hỗ trợ bắt đầu / dừng audiobook cho cô ấy?
Havnar

Xin chào Havnar, Nope, thực sự. Cô ấy có hai con chó trong nhà và đó chỉ là về nó ... Một điều tôi bỏ qua khi đề cập, tôi tin rằng, cô ấy cũng không có kết nối internet.
LeoFib

Được rồi một vài câu hỏi. Tôi sẽ giữ chúng ngắn vì lý do ngắn gọn. 1) RasPi 2 cho điều này, đúng không? 2) Hệ điều hành nào bạn muốn giới thiệu cho việc này? 3) Bạn có nghĩ rằng điều này sẽ có thể thực hiện được nếu không có WIFI? --She không có kết nối mạng, than ôi. 4) Apache được sử dụng để chạy máy chủ hay là hệ điều hành? 5) Tôi có nên bắt đầu làm quen với linux và các lệnh của nó để tự chuẩn bị không? Đây là một ý tưởng: youtube.com/watch?v=NCVWX4suGE4 Bạn nghĩ gì? Tôi có nên đi với một bộ RPI 2 chung? - Rất cám ơn và chúc mừng năm mới.
LeoFib

1
1) pi2 mạnh hơn rất nhiều, điều này sẽ có lợi cho bạn dù bạn đi bằng cách nào. 2) raspbian là ứng dụng thân thiện với người dùng nhất và được sử dụng nhiều nhất, vì vậy dễ dàng tìm thấy hướng dẫn và trợ giúp trên 3) bạn có thể có wifi mà không cần kết nối internet, không cần thiết lập không dây nếu bạn sử dụng điều khiển từ xa hồng ngoại 4) rất nhiều máy chủ web apache beeing một được sử dụng rộng rãi 5) có, một kỹ năng hữu ích không hơn không kém! 5B) bạn có thể bắt đầu với pi2 bằng sdcard, cáp hdmi, bộ đổi nguồn và bắt đầu chơi với nó. Một số kỹ năng phát triển ứng dụng có thể hữu ích.
Havnar

1
Tôi đoán rằng tôi có một quan điểm khác về mọi thứ so với Havnar, vì vậy câu trả lời của tôi ở đây: 1) Không cần thiết, 1B cũng đủ mạnh để tôi nghĩ, nhưng dù sao thì 2 vẫn an toàn 2) ) Apache là phần mềm máy chủ web, do đó bạn có thể chạy các trang web của riêng mình trên một hệ thống (raspi trong trường hợp này). Có nghĩa là bạn hoàn toàn không cần một kết nối internet vì trang web sẽ chạy trên RasPi của bạn. 5) Có, một số dòng lệnh cơ bản là hữu ích để có được raspbian và apache chạy tôi nghĩ.
Rien Heuver

4

Tôi đã thực hiện một số hoạt động đào nhẹ cho bạn vì hầu hết mọi thứ có thể trở nên quá phức tạp khá nhanh đối với đối tượng mục tiêu của bạn.

Từ kinh nghiệm cá nhân của tôi, các nút và gui (cho dù đơn giản trong mắt dev của bạn ) có thể đi qua gây khó hiểu cho người già.

Tôi không biết các kỹ năng của bạn tốt như thế nào với sự phát triển (web) hoặc nếu bạn có thể có được một nhà phát triển lành nghề có động lực để giúp bạn đạt được mục tiêu của mình, nhưng sự đơn giản cho người dùng cuối là chìa khóa ở đây.

Do đó, "The One Nút Audiobook Player" có thể là thứ bạn đang tìm kiếm. Hoặc có thể là một sự thích nghi với nó.

giải nén dưới đây:

It basically consists of:

1 Raspberry Pi
1 ModMyPi enclosure
1 button
2 resistors (330 Ohm, 10 Kilo-Ohm)
1 blue LED
1 (slow) 8GB SD-Card
some wire
a pair of speakers

Phần mềm sau đây đã được sử dụng:

Raspbian minimal image (http://www.linuxsystems.it/2012/06/raspbian-wheezy-armhf-raspberry-pi-minimal-image)
mpd (music player daemon)
mpc
mpd-python
pyudev (for USB access)
a self-written python script

Các tính năng như sau:

  • luôn bật: Khi bạn bật mâm xôi, nó sẽ khởi động và khởi động tập lệnh python với sách âm thanh tạm dừng

  • Sử dụng một nút: Nút tạm dừng và bỏ tạm dừng sách âm thanh hoặc quay lại một bản nhạc khi bạn nhấn nút dài hơn 4 giây

  • nhớ vị trí: Nó sẽ luôn nhớ vị trí chơi cuối cùng

  • chỉ có một cuốn sách nói: Sẽ luôn có một cuốn sách âm thanh trên Raspberry

  • triển khai sách âm thanh dễ dàng: Khi bạn cắm ổ USB với tên / nhãn đặc biệt, Raspberry sẽ dừng phát, gắn ổ đĩa ngón tay cái, xóa sách âm thanh cũ, sao chép sách mới, xây dựng lại danh sách phát và - sau khi rút phích cắm ổ ngón tay cái - bắt đầu audiobook mới ở chế độ tạm dừng

  • đa định dạng: Vì sử dụng mpd, trình phát hỗ trợ Ogg Vorbis, FLAC, OggFLAC, MP2, MP3, MP4 / AAC, MOD, Musepack và wave

>>> nguồn <<< --- tất cả tín dụng đến đó!

liên kết github


Sử dụng một phím điều khiển, người ta có thể mở rộng giao diện điều khiển nếu được thực hiện cẩn thận để trình bày một giao diện người dùng đơn giản và nhất quán cho đối tượng mục tiêu - một người bình luận trên trang web được liên kết lưu ý rằng nó chỉ nhớ vị trí chơi trong khi RPi được cấp nguồn - đó có thể là một cái gì đó để sửa đổi - mặc dù tôi chắc chắn rằng khi tôi thực hiện một số thử nghiệm với máy chủ âm nhạc LAN, việc mpdghi nhớ nó nằm ở đâu trong một danh sách phát dài, có thể có một tùy chọn cho nó ...
SlySven

Không có lý do gì để không để lại một pi cung cấp năng lượng, tốt hơn hết là dù sao thẻ sd của Pi, nó không được xây dựng để tắt.
Havnar

" ... nó không được xây dựng để tắt. " Có lẽ tốt hơn nên nói, "không chịu được việc mất điện mà không được tắt máy đúng cách." - Một UPS cho Pi tôi có cơ sở để khởi động và tắt Pi theo chu kỳ hẹn giờ của bất cứ thứ gì trong khoảng thời gian từ 2-1000 phút BẬT và 2-1000 phút TẮT - sẽ có các ứng dụng trong chụp ảnh vượt thời gian - và ở đó không có dấu hiệu nào cho thấy điều này vốn có hại - mặc dù tôi đồng ý rằng Thẻ SD có thể "hao mòn" nhanh hơn một chút so với việc ghi tệp nhật ký bổ sung đó.
SlySven
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.