利用python对视频字幕进行识别--688IT编程网

利⽤python对视频字幕进⾏识别

import easyocr

import cv2 as cv

from PIL import Image

video_file = cv.VideoCapture(r"f4459201ee68667a36dee475fe96159c.mp4")

video_fps=(cv.CAP_PROP_FPS)

print((cv.CAP_PROP_FPS))

total_frames = int((cv.CAP_PROP_FRAME_COUNT))

image_size = (int((cv.CAP_PROP_FRAME_HEIGHT)), int((cv.CAP_PROP_FRAME_WIDTH)))

学python看谁的视频比较好frames_height,frames_weight=image_size[0],image_size[1]

print(frames_height)

count_frame_start=0

count_frame_end=0

thresh = 220#设定阈值进⾏⼆值化

temporary_frame=[]

reader=easyocr.Reader(["ch_sim","en"],gpu=False)#⽤于识别⽂字

"""

下⾯函数分别计算是否有字幕的区别字幕是否相同的

相当于从⽆----->有计算每张图像与 0 值图像的误差

return ((img - imgo) ** 2).sum() / img.size * 100 可以添加到代码中，然后变成属于你⾃⼰的代码

有----->变化接着计算相同字幕和不同字幕图像直接的误差

"""

def cal_video(img, imgo=None):

return ((img - imgo) ** 2).sum() / img.size * 100

while True:

success, frames = ad()

print("打开第{}帧".format(count_frame_start))

frames_cut = frames[:, :, 0]#[(486, 864)]

frames_wh_cut = frames_cut[frames_height-75: frames_height-6, :]

_, frames_threshold = cv.threshold(frames_wh_cut, 220, 255, cv.THRESH_BINARY)

temporary_frame.append(frames_threshold)

if count_frame_start>1:

del temporary_frame[0]

if cal_video(temporary_frame[1],temporary_frame[0])>2:

print("程序运⾏！第{}帧".format(count_frame_start))

result = adtext(frames_wh_cut)

if len(result)>0:

f=open("嫦娥奔⽉.txt", "a", encoding="utf-8")

f.write(str(count_frame_end) + "--->" + str(count_frame_start)+"\n")

f.write(str(result[0][1])+"\n")

f.close()

count_frame_end = count_frame_start

count_frame_start+=1

#cv.imwrite(r"D:\PycharmProjects\pythonProject\feiji\image{}.jpg".format(count_frame_start),frames_wh_cut)

else:

continue

else:

pass

count_frame_start+=1

⼤家运⾏程序注意⼀下⼏点：

1.更改视频地址，选择你需要进⾏字幕识别的视频地址

2.对所截取的视频字幕图⽚进⾏⼆值化，其中阈值可以⾃⼰更改

3.相邻图⽚的相似值的阈值可以进⾏更改。

总体来说，识别还是有⼀些问题的，⼤家将这个代码跑完之后就会发现问题所在，如果谁能够提升效果，希望告知，谢谢。

688IT编程网

利用python对视频字幕进行识别

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

利用python对视频字幕进行识别

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

非零金额正则表达式

半小时正则表达式