Chương trình tự động tạo phụ đề bằng cách sử dụng lời nói thành văn bản?


12

Tôi có một video mà tôi muốn tạo phụ đề cho. Có chương trình nào có thể thực hiện lời nói thô sơ thành văn bản để

  1. đặt bắt đầu / dừng chính xác của từng phụ đề riêng lẻ
  2. tạo phụ đề văn bản thô sơ (sử dụng một số loại lời nói thành văn bản)

Tôi biết về phụ đề gnome. Tuy nhiên, nó đòi hỏi nỗ lực rộng rãi để tạo ra những phụ đề đó bằng tay. Bạn cần chọn cho mình điểm bắt đầu và điểm dừng cho mỗi câu.

Youtube có các tính năng trên (tạo phụ đề văn bản thô sơ theo đúng thời gian, sử dụng lời nói thành văn bản). Tuy nhiên, tôi không muốn tải video lên Youtube chỉ để lấy phụ đề của mình. Có thể làm phụ đề hiệu quả trong Ubuntu không?

Cập nhật : Tôi dự định chỉ sử dụng phụ đề .srt và không cần mã cứng chúng trên video. Yêu cầu lớn nhất của tôi là để chương trình tự động tìm điểm bắt đầu / dừng cho mỗi câu, để tôi viết văn bản trong đó.

Cập nhật # 2 : Có phần mềm Speech-to-Text cho Linux, với gói Nhân sư CMU. Có thể sử dụng Nhân sư CMU với chương trình phụ đề theo http://sourceforge.net/projects/cmusphinx/forums/forum/5471/topic/3949891 Ngoài ra, một công cụ phụ đề biết về tính năng Nhân sư CMU này, http: //groups.google.com/group/universal-subtitle-testing/browse_thread/thread/613361ffb921b43b (công cụ dựa trên web), tuy nhiên không có tài liệu tham khảo nào trong mã nguồn mới nhất mà họ đã thêm CMU Sphinx. Nhiệm vụ tiếp tục tìm một chương trình sử dụng Nhân sư CMU cho lời nói thô sơ thành văn bản (cũng sẽ đặt thời gian chính xác), như Youtube đã làm.


Tôi nghĩ có một ứng dụng gọi là magpie có chức năng như thế này.
RolandiXor

Câu trả lời:


3

Tôi đã sử dụng Aegisub trên Windows vài năm trước và thực sự hài lòng với nó. Rõ ràng nó có sẵn cho Linux. Nó là khá tự giải thích.

Aegisub chỉ tạo tệp phụ đề, ví dụ: tệp .srt. Để kết hợp video và phụ đề để tạo phụ đề được mã hóa cứng, bạn vẫn cần sử dụng chương trình thứ hai.
Trên Windows tôi đã sử dụng VirtualDub, nhưng nó không có sẵn cho Linux. Bạn có thể sử dụng VLC để làm điều này trên Linux :

Tạo subs của bạn trong Aegisub, lưu nó như bình thường dưới dạng tệp .ass.

Sử dụng VLC để thêm bản nhạc phụ đề đó vào video của bạn. Phụ đề -> Thêm tệp phụ đề ...

Định cấu hình kiểu hiển thị phụ đề và cài đặt để chúng hiển thị theo ý thích của bạn. Công cụ -> Tùy chọn -> Phụ đề / OSD

Bây giờ bạn có thể xem video để đảm bảo chương trình phụ được hiển thị như bạn dự định. Ví dụ: tôi có thể kiểm tra một số phụ mà tôi đã chỉ định trong Aegisub sẽ được hiển thị ở trên cùng của màn hình thay vì ở dưới cùng.

Đầu ra sẽ giống hệt như hiện tại, vì vậy hãy chắc chắn rằng tất cả đều tốt.

  1. Chuyển đến Phương tiện -> Chuyển đổi / Lưu ... (Ctrl + R).

  2. Trong mục Chọn tệp, thêm tệp video của bạn. Đánh dấu vào "Sử dụng tệp phụ đề" và duyệt đến tệp phụ .ass của bạn.

  3. Nhấp vào mũi tên xuống trên nút Chuyển đổi / Lưu và nhấp vào Chuyển đổi ... (Alt + O).

  4. Trong Cài đặt, đảm bảo tùy chọn Chuyển đổi được chọn. Chọn tùy chọn Hiển thị đầu ra. Dự phòng không được thêm vào vì một số lý do trừ khi bạn đánh dấu vào đây.

  5. Chỉnh sửa cấu hình để cài đặt video và âm thanh là những gì bạn muốn. Trong tab phụ đề, đánh dấu vào ô Phụ đề và sử dụng codec phụ đề DVB. Đảm bảo bạn đánh dấu 'Lớp phủ phụ đề trên video'. Nhấn lưu.

  6. Nhập thư mục đích và tên tệp trong hộp Đích.

  7. Nhấn bắt đầu.

Đợi nó được thực hiện, và đó là nó. Thông báo trước cho phương pháp này là việc mã hóa sẽ diễn ra trong thời gian thực với video, vì vậy nếu bạn có video 2 giờ, sẽ mất 2 giờ. Điều này là do đánh dấu vào ô 'Hiển thị đầu ra'. Nhưng vì một số lý do, nó chỉ hoạt động khi bạn đánh dấu vào đây.

Ngoài ra còn có các biên tập viên phụ đề khác .

Cập nhật:
Tôi không nhớ Aegisub có chức năng tự động đặt bắt đầu và kết thúc câu nói trong tệp phụ đề. Và tôi không thấy đề cập đến chức năng như vậy ở bất cứ đâu trên trang web. Tuy nhiên, với (các tổ hợp phím) khá dễ dàng để đặt các lần đó theo cách thủ công.

Thậm chí có chương trình nào có chức năng như vậy (trong bất kỳ hệ điều hành nào) không?


Tôi cũng đã sử dụng Aegsub trên Windows, tôi không nhận ra rằng nó có sẵn cho Linux .. cảm ơn Pit :) ... Aegsub là một người phụ đề rất có thẩm quyền ... định dạng mặc định của nó là ASS (một sự phát triển từ SSA .. Sub-StationAlpha định dạng) .. nó xử lý Unicode và có các công cụ đặc biệt để chuẩn bị văn bản Karaoke ....
Peter.O

2
Cảm ơn Aegisub. Tôi đang cố gắng tìm ra quy trình làm việc cho chương trình này. Nó có thể quét toàn bộ video và tạo thời gian cho mỗi câu phụ đề không? Nó dường như không có tính năng chuyển lời nói thành văn bản.
dùng4124

Bạn có thể muốn đọc docs.aegisub.org/manual/ .
Hố

Aegisub không tự động tạo phụ đề. Chúng tôi phải viết phụ đề bằng cách sử dụng nó. Vì vậy, có lẽ đây không phải là giải pháp cho câu hỏi này.
Harshitha Palihawadana

Các câu hỏi đã được chỉnh sửa 3 năm (!) Sau câu trả lời của tôi. Bản gốc "Chương trình nào được sử dụng để tạo phụ đề cho video" không đề cập bất cứ điều gì từ tự động hoặc chuyển văn bản thành giọng nói.
Hố

3

Tôi không tìm được cách để chương trình phụ đề tự động thêm phụ đề thô sơ, bằng cách phân tích giọng nói trong video.

Do đó, sự thay thế mà tôi sử dụng là

  1. Tải video lên Youtube (ví dụ: riêng tư) và sử dụng tiện ích trong bản dựng để tạo phụ đề thô sơ tự động.

Sau đó,

  1. Thêm video vào http://www.universalsubtitle.org/ và tạo thủ công các khung thời gian cho mỗi câu, nếu cách tự động trong Youtube không hoạt động hoặc các câu bị sai.
  2. Sử dụng phụ đề Gnome (được tìm thấy trong Trung tâm phần mềm) để dọn dẹp phụ đề và sửa bất kỳ thời gian nào.

1
Câu trả lời này dường như có liên quan nhất đến câu hỏi tự động tạo các tệp phụ đề.
Garrett

Thật đáng ngạc nhiên khi YouTube có thể tự động tạo phụ đề (thô), nhưng dường như không có chương trình nào có thể.
Garrett

3

Cá nhân tôi thích phụ đề Gnome nó có sẵn trong kho.

sudo apt-get install gnome-subtitles

1

Bạn có thể sử dụng tiện ích Dòng lệnh này

Autosub là một tiện ích để nhận dạng giọng nói tự động và tạo phụ đề. Nó lấy video hoặc tệp âm thanh làm đầu vào, thực hiện phát hiện hoạt động giọng nói để tìm các vùng giọng nói, thực hiện các yêu cầu song song với Google Web Speech API để tạo phiên âm cho các vùng đó, (tùy chọn) dịch chúng sang ngôn ngữ khác và cuối cùng lưu kết quả phụ đề vào đĩa.

https://github.com/agermanidis/autosub/

Người dùng Python3, làm điều này:

pip install git+https://github.com/BingLingGroup/autosub.git@alpha

Hãy chắc chắn rằng bạn đã cài đặt ffmpeg.


0

Ok, tìm thấy một số công cụ trông đẹp và tương tự như hội thảo phụ đề - trình chỉnh sửa phụ đề (apt-get install phụ đề).

Đã thử so sánh nó với Phụ đề Gnome, trình chỉnh sửa phụ đề có vẻ công cụ nâng cao hơn.


0

Đối với KDE, một trình soạn thảo phụ đề tốt là trình soạn thảo phụ. Cài đặt nó bằng lệnh

sudo apt-get install subtitlecomposer

hoặc sử dụng phụ đề liên kết Cài đặt phụ đề

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.