lesserpython视频硬字幕提取内嵌字幕提取⼯具
python入门教程视屏项⽬简介
video-subtitle-extractor是⼀款将视频中的硬字幕提取为外挂字幕⽂件(srt格式)的软件。
主要实现了以下功能:
提取视频中的关键帧
检测视频帧中⽂本的所在位置
识别视频帧中⽂本的内容
过滤⾮字幕区域的⽂本
去除重复字幕⾏,去除⽔印(台标)⽂本
⽣成srt字幕⽂件
多语⾔:⽀持中⽂、⽇语、韩语、法语、德语字幕的提取
下载地址:
Windows GPU版本:
国内:、
国外: 、
Windows CPU版本:
国内:
国外:
MacOS CPU版本:
国内:
国外:
项⽬特⾊
采⽤本地进⾏OCR识别,⽆需设置调⽤任何API,不需要接⼊百度、阿⾥等在线OCR服务即可本地完成⽂本识别⽀持GPU加速,GPU加速后可以获得更⾼的准确率与更快的提取速度
(CLI版本) ⽆需⽤户⼿动设置字幕区域,项⽬通过⽂本检测模型⾃动检测字幕区域
(GUI版本) 图形化界⾯
点击【打开】后选择视频⽂件,调整字幕区域,点击【运⾏】
有任何改进意见请在ISSUES中提出
演⽰
点击查看视频教程
在线运⾏
使⽤Google Colab Notebook(免费GPU):
PS: Google Colab只能运⾏CLI版本
使⽤说明
1. 下载安装Anaconda
2. 使⽤conda创建项⽬虚拟环境并激活环境 (建议创建虚拟环境运⾏,以免后续出现问题)
conda create --name videoEnv python=3.8
conda activate videoEnv
3. 安装依赖⽂件
请确保你已经安装 python 3.8+
CPU⽤户 (mac⽤户) :
linux性能优化安装依赖:
pip install -
文本框形状样式在哪里设置GPU⽤户(有N卡): 要达到⾼精度的识别率请使⽤GPU版
安装CUDA 10.2和cuDNN 7.6.5
Linux⽤户
(1) 下载CUDA 10.2
wget developer.download.nvidia/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
(2) 安装CUDA 10.2
sudo sh cuda_10.2.89_440.33.01_linux.run --override
1. 输⼊accept
2. 选中CUDA Toolkit 10.2(如果你没有安装nvidia驱动则选中Driver,如果你已经安装了nvidia驱动请不要选中driver),之后
mock location选中install,回车
3. 添加环境变量
在 ~/.bashrc 加⼊以下内容
在 ~/.bashrc 加⼊以下内容
# CUDA
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
使其⽣效
source ~/.bashrc
(3) 下载cuDNN 7.6.5
国外:
(4) 安装cuDNN 7.6.5
tar -zxvf cudnn-10.2-linux-x64-v7.6.
sudo cp ./cuda/include/* /usr/local/cuda-10.2/include/
sudo cp ./cuda/lib64/* /usr/local/cuda-10.2/lib64/
sudo chmod a+r /usr/local/cuda-10.2/lib64/*
delphi城sudo chmod a+r /usr/local/cuda-10.2/include/*
Windows⽤户
(1) 下载CUDA 10.2
(2) 安装CUDA 10.2
(3) 下载cuDNN 7.6.5
国外:
(4) 安装cuDNN 7.6.5
将cuDNN解压后的cuda⽂件夹中的bin, include, lib⽬录下的⽂件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\ 对应⽬录下
安装paddlepaddle:
conda install -y paddlepaddle-gpu==2.1.0 cudatoolkit=10.2 --channel mirrors.tuna.tsinghua.edu/anaconda/cloud/Paddle/如果安装cuda 10.2,请对应安装7.6.5的cuDNN, 请不要使⽤cuDNN v8.x 和 cuda 10.2的组合安装其他依赖:
pip install -r
4. 运⾏程序
运⾏图形化界⾯版本(GUI)
python gui.py
运⾏命令⾏版本(CLI)
python main.py
常见问题与解决⽅案
1. CondaHTTPError
2. Windows下出现geos_c.dll错误
_lgeos = CDLL(os.path.join(sys.prefix, 'Library', 'bin', 'geos_c.dll'))
File "C:\Users\Flavi\anaconda3\envs\subEnv\lib\ctypes\__init__.py", line 364, in __init__ self._handle = _dlopen(self._name, mode)
OSError: [WinError 126] 不到指定的模块。
解决⽅案:
1. 卸载Shapely
pip uninstall Shapely -y
2. 使⽤conda重新安装Shapely
conda install Shapely
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论