(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 101599124 A
(43)申请公布日 2009.12.09
(21)申请号 CN200810114319.1
(22)申请日 2008.06.03
(71)申请人 汉王科技股份有限公司
    地址 100193 北京市海淀区东北旺西路8号5号楼三层
(72)发明人 黄磊 刘昌平 程豪
(74)专利代理机构 北京集佳知识产权代理有限公司
    代理人 逯长明
(51)Int.CI
      G06K9/32
      G06K9/72
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种从视频图像中分割字符的方法和装置
(57)摘要
      本发明公开了一种从视频图像中分割字符的方法,包括:在视频图像中定位原始字符图像;从所述原始字符图像中抽取字符笔画信息,并依据所述字符笔画信息获得所述原始字符图像的二值笔画图;针对所述二值笔画图中的字符区域建立颜模型,并依据所述颜模型提取所述字符区域的颜层图像;使用改进的带笔画掩码的连通体分析法去除多余的背景和噪声得到目标字符图像。本发明无需机器学习,计算量小,性能好,可以快速、准确地从复杂背景的视频图像中准确地分割出字符。
法律状态
法律状态公告日
法律状态信息字符串截取几段方法
法律状态
权 利 要 求 说 明 书
1、一种从视频图像中分割字符的方法,其特征在于,包括:
在视频图像中定位原始字符图像;
从所述原始字符图像中抽取字符笔画信息,并二值化所述字符笔画信息,获得所述原始字符图像的二值笔画图;
针对所述二值笔画图中的字符区域建立颜模型,并依据所述颜模型提取所述字符区域的颜层图像;
生成所述原始字符图像的笔画掩码图,依据所述笔画掩码图去除所述颜层图像的多余背景。
2、如权利要求1所述的方法,其特征在于,还包括:
对所述颜层图像进行去噪处理。
3、如权利要求1或2所述的方法,其特征在于,所述生成原始字符图像的二值笔画图的步骤进一步包括:
S31、若所述原始字符图像为正向文本图像,则执行步骤S33-S34;若所述原始字符图像为负向文本图像,则执行步骤S32-S34;
S32、将所述负向文本图像反处理为正向文本图像;
S33、在所述正向文本图像中计算预设方向上笔画的强度值,并提取最大的强度值构成正向笔画特征图;
S34、对所述正向笔画特征图进行二值化,获得正向二值笔画图。
4、如权利要求3所述的方法,其特征在于,所述生成原始字符图像的笔画掩码图的步骤进一步包括:
S41、若所述原始字符图像为正向文本图像,则执行步骤S42-S45;若所述原始字符图像为负向文本图像,则执行步骤S43-S45;
S42、将所述正向文本图像反处理为负向文本图像;
S43、在所述负向文本图像中计算预设方向上笔画的强度值,并提取最大的强度值构成负向笔画特征图;
S44、对所述负向笔画特征图进行二值化,获得负向二值笔画图;
S45、取所述正向二值笔画图和负向二值笔画图的并集为笔画掩码图。
5、如权利要求4所述的方法,其特征在于,所述依据笔画掩码图去除颜层图像的多余背景的步骤进一步包括:
采用种子生长法在所述颜层图像中、除笔画掩码图掩码以外的区域进行种子填充,获得去除多余背景后的颜层图像。
6、如权利要求1所述的方法,其特征在于,所述视频图像为多帧包含同一文本对象的视频图
像,所述原始字符图像为经过多帧视频图像融合获得的多帧增强图像。
7、一种从视频图像中分割字符的装置,其特征在于,包括:
字符图像定位模块,用于在视频图像中定位原始字符图像;
笔画提取模块,用于从所述原始字符图像中抽取字符笔画信息,并二值化所述字符笔画信息,获得所述原始字符图像的二值笔画图;
颜特征处理模块,用于针对所述二值笔画图中的字符区域建立颜模型,并依据所述颜模型提取所述字符区域的颜层图像;
连通体分析模块,用于生成所述原始字符图像的笔画掩码图,并依据所述笔画掩码图去除所述颜层图像的多余背景。
8、如权利要求7所述的装置,其特征在于,还包括:
去噪模块,用于对所述颜层图像进行去噪处理。
9、如权利要求7或8所述的装置,其特征在于,若所述原始字符图像为正向文本图像,则所述笔画提取模块触发正向笔画信息计算子模块、正向笔画特征图构造子模块和正向二值化处理子模块;
或者,若所述原始字符图像为负向文本图像,则所述笔画提取模块触发第二反处理子模块、正向笔画信息计算子模块、正向笔画特征图构造子模块和正向二值化处理子模块;
其中,所述第二反处理子模块用于将所述负向文本图像反处理为正向文本图像;所述正向笔画信息计算子模块,用于在所述正向文本图像中计算预设方向上笔画的强度值;所述正向笔画特征图构造子模块,用于提取最大的强度值构成正向笔画特征图;所述正向二值化处理子模块,用于对所述正向笔画特征图进行二值化,获得正向二值笔画图。
10、如权利要求9所述的装置,其特征在于,若所述原始字符图像为正向文本图像,则所述连通体分析模块触发第一反处理子模块、负向笔画信息计算子模块、负向笔画特征图构造子模块、负向二值化处理子模块和合并子模块;
或者,若所述原始字符图像为负向文本图像,则所述连通体分析模块触发负向笔画信息计算子模块、负向笔画特征图构造子模块、负向二值化处理子模块和合并子模块;
其中,所述第一反处理子模块用于将所述正向文本图像反处理为负向文本图像;所述负向笔画信息计算子模块,用于在所述负向文本图像中计算预设方向上笔画的强度值;所述负向笔画特征图构造子模块,用于提取最大的强度值构成负向笔画特征图;所述负向二值化处理子模块用于对所述负向笔画特征图进行二值化,获得负向二值笔画图;所述合并子模块用于取所述正向二值笔画图和负向二值笔画图的并集为笔画掩码图。
说  明  书
技术领域
本发明涉及视频字符识别领域,特别涉及一种从视频图像中分割字符的方法以及一种从视频图像中分割字符的装置。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。