Sẽ trích xuất phụ đề được mã hóa cứng như tác phẩm này?


1

Tôi có một mp4 với phụ đề được mã hóa cứng và tôi muốn tạo một tệp SRT.

Tôi đã thử sử dụng phần mềm video OCR AviSub. Nó đã đúng thời gian nhưng bản thân các từ rất không chính xác, vì vậy tôi nhận được một tệp SRT trông như thế này:

1
00:01:22,277 --> 00:01:27,271
innacurate text
innacurate text
2
00:01:38,501 --> 00:01:41,668
innacurate text

Bây giờ tôi có thời gian, tôi muốn:

  1. Sử dụng ffmpeg để trích xuất một khung từ mỗi thời gian đó (Tôi không biết làm thế nào để làm điều này).

  2. Batch OCR tất cả các khung hình đó bằng một phần mềm OCR chính xác như Readiris (mỗi khung hình thành một tệp txt riêng).

  3. Sử dụng tập lệnh Python để thay thế phụ đề trong tệp SRT cũ bằng chính xác từ mỗi tệp văn bản mới đã được tạo.

Cảm ơn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.