Nhận dạng giọng nói - MP3 thành phần mềm văn bản [đã đóng]


16

Tôi đang tìm kiếm một chương trình độc lập với loa (thương mại hoặc miễn phí) cho phép tôi phiên âm các tệp MP3 có chứa bản ghi giọng nói (đặc biệt là podcast) thành văn bản. Tôi muốn dùng thử Dragon Natatural Talking, nhưng có vẻ như nó chỉ hỗ trợ phiên âm các bản thu âm lời nói của tôi. Vậy đâu là những lựa chọn thay thế?


Nhận xét của Avi: Tôi không tin điều đó là có thể - độc lập với người nói
Ivo Flipse

Hệ điều hành gì?
studiohack

Windows hoặc Linux.
pako

Câu trả lời:


7

Dragon Natatural Talking sẽ nhập các tệp mp3 và cố gắng sao chép chúng. Nó thích điều chỉnh nhận dạng giọng nói của mình cho từng người nói, nhưng thực hiện công việc một cách công bằng mà không cần điều chỉnh. Nó có thể hoạt động tốt nhất nếu loa podcast của bạn nghe giống như Tom Brokaw.


2
Tôi đã thử Dragon Natatural Talking, nhưng nó đã làm một công việc tồi tệ cho các podcast với những người nói không xác định. Nó chỉ hoạt động khá tốt với giọng nói của chính tôi sau khi đào tạo chương trình.
pako

1
Nó cũng có thể nhập các tệp âm thanh khác và sao chép chúng?
Larry Morries

4

Một giải pháp khả thi là tải video của bạn lên Youtube và thử chú thích tự động mà bạn có thể bật ... nó chưa quá chính xác, nhưng bạn có thể tải xuống tệp phụ đề và tự chỉnh sửa, nếu điều đó giúp ... như đối với các vấn đề bản quyền / vi phạm bản quyền cho bài hát, bạn có thể đặt video ở chế độ riêng tư trên hồ sơ của mình, nếu điều đó thậm chí có thể?


1
@studioback: Phương thức này của Youtube chỉ được áp dụng cho video của chính mình chứ không phải phương thức được người khác tải lên?
StackExchange cho tất cả

1
@Tim: thực sự là cho cả hai.
studiohack

1
@studiohack: Đối với những video được người khác tải lên, làm thế nào để làm điều đó? Ý tôi là, không tải xuống và tải lên như video của riêng tôi?
StackExchange cho tất cả các

1
Trên hầu hết các video, có một biểu tượng CC ở phía dưới, nhấp vào nó và sau đó tự động sao chép ...
studiohack


2

Tôi sẽ cảnh báo không nên thử Dragon Natatural Talking - Tôi đã viết một số tập lệnh trên iphone đã bẻ khóa của mình để sao chép / chuyển đổi tất cả các tập tin thư thoại từ điện thoại của tôi sang một thư mục trên PC của tôi và có dịch vụ sao chép Dragon Natatural Talking chạy với chúng.

Kết quả của việc chạy phiên âm đối với các tệp có các loa khác nhau là hoàn toàn không thể sử dụng được. Tôi đã thử một số lựa chọn thay thế nguồn mở nhưng nhận dạng giọng nói độc lập với người nói dường như vẫn bị giới hạn trong các từ điển rất nhỏ.


1

Tôi đang sử dụng http://www.voicebase.com với podcast và video bằng tiếng Anh và nó hoạt động rất tốt. Nó miễn phí trong 50 giờ âm thanh.

Bạn có thể tải về phiên âm âm thanh trên rtf, srt hoặc pdf.

Bạn có thể tải xuống bản sao máy khoảng 10-15 phút sau khi bạn tải lên, và đôi khi, sớm.


1

Nguồn mở: Nhân sư CMU

License: http://www.e-speaking.com/ (Windows)

Thương mại: Dragon NataturalSpeaking (Windows)

Bạn cũng có thể thử phương pháp này nếu bạn đang thử với osx có thể được thực hiện bằng cách sử dụng âm thanh và âm thanh

Bạn cũng có thể tìm thấy một số liên kết có liên quan để mở nguồn phần mềm chia sẻ khác đáng để thử là voxcripecc

Nếu bạn là lập trình viên .net, bạn có thể sử dụng phương pháp này để tạo bộ công cụ của riêng mình


0

Podzinger sẽ là một giải pháp tuyệt vời, nhưng tôi không chắc rằng đoạn đường nối (tên mới của công ty từng là EveryZing, người sản xuất Podzinger) cung cấp dịch vụ miễn phí nữa ...

http://en.wikipedia.org/wiki/Podzinger

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.