video-subtitle-extractor是一款国人开源的视频硬字幕提取工具,可自动生成 srt 文件,无需申请第三方 API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。基于Python编写,遵守Apache2.0开源协议。

功能特色:

  • 采用本地进行OCR识别,无需设置调用任何API,不需要接入百度、阿里等在线OCR服务即可本地完成文本识别
  • 支持GPU加速,GPU加速后可以获得更高的准确率与更快的提取速度
  • (CLI版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
  • (GUI版本) 图形化界面
  • 提取视频中的关键帧
  • 检测视频帧中文本的所在位置
  • 识别视频帧中文本的内容
  • 过滤非字幕区域的文本,去除水印(台标)文本
  • 去除重复字幕行,生成srt字幕文件
  • 支持视频字幕批量提取(打开文件的时候选择多个视频)
  • 多语言:支持中文/英文日语韩语阿拉伯语繁体中文法语德语俄语西班牙语葡萄牙语意大利语字幕的提取
  • 多模式:
    • 快速 – 快速提取字幕但可能丢字幕(推荐)
    • 精准 – 不丢字幕但速度较慢

源码:https://github.com/YaoFANGUK/video-subtitle-extractor