(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 103258196 A (43)申请公布日 2013.08.21 | ||
(21)申请号 CN201310209927.1
(22)申请日 2013.05.30
(71)申请人 电子科技大学
地址 611731 四川省成都市高新区(西区)西源大道2006号
(72)发明人 李晓峰 周洁芸 舒畅 刘洪盛 徐进
(74)专利代理机构 电子科技大学专利中心
代理人 周刘英
(51)Int.CI
G06K9/00
权利要求说明书 说明书 幅图 |
(54)发明名称
复杂环境中紧连字符串的字符分离方法 | |
(57)摘要
本发明公开了一种复杂环境中紧连字符串的字符分离方法,属于图像处理技术领域。本发明运用字符串的包络信息初定位初级分点,再根据初级分点的滤波处理,生成二级分点,进而获取初级切分点,最后再对初级切分点进行校准,以准确定位切分位置,以此实现对采集的字串图像的切割处理,达到复杂环境中紧连字串分离的目的。本发明的应用,实现了在复杂环境下,对紧连字串的切分,且适用于不同字体,其运算复杂度低,切分准确性高。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2016-05-18 | 授权 | 授权 |
2013-09-18 | 实质审查的生效 | 实质审查的生效 |
2013-08-21 | 公开 | 公开 |
2021-05-11 | 未缴年费专利权终止 | 未缴年费专利权终止 |
权 利 要 求 说 明 书
1.复杂环境中紧连字符串的字符分离方法,其特征在于,包括下列步骤:
步骤1:对采集的字符串图像进行预处理,求取字符串的上包络值、下包络值,所述上 包络值为字符串中字符的上边缘距离字符串图像上边缘的距离;所述下包络值为字符串中字 符下边缘距离字符串图像下边缘的距离;
步骤2:基于所述上下包络值提取初级分点:
设定字符串的水平坐标上各点的权值:
若当前点对应的上、下包络值均为字符串图像的高度,则设定为第一权值;
若当前点对应的上、下包络值同时局部最大,则设定为第二权值,所述第二权值小于第 一权值;
若当前点对应的上包络值局部最大,则设定权值为第三权值,所述第三权值小于第二权 值;
若当前点对应的下包络值局部最大,则设定权值为第四权值,所述第四权值小于第三权 值;
fastjson字符串转数组
否则设定当前点的权值小于所述第四权值;
提取权值局部最大所对应的点为初级分点;
步骤3:基于所述初级分点对应的权值,对初级分点进行低通滤波处理,得到二级分点, 取各二级分点为初级切分点;
步骤4:对所述初级切分点进行校准,确定切分位置。
2.如权利要求1所述的方法,其特征在于,所述步骤3中,基于初级分点得到二级分点 为:
若当前初级分点与近邻的局部区域密度小于预设阈值,则将所述局部区域汇聚为一点, 作为二级分点;否则直接提取当前初级分点为二级分点。
3.如权利要求2所述的方法,其特征在于,对密度小于预设阈值的局部区域进行汇聚时, 提取所述局部区域的中心位置所对应的初级分点为二级分点。
4.如权利要求1、2或3所述的方法,其特征在于,所述步骤3中,还包括,过滤二级 分
点中的干扰点,得到最终分点:
基于各二级分点的相邻间距,设定参考分点间距DS,并根据所述DS检测并过滤二级分 点中的干扰点,所述干扰点的检测为:
步骤3-1:依序确定首个与其右邻居的间距小于或等于w*DS的二级分点X,由所述二级 分点X的前一个分点作为当前起点S,其中所述w∈[0.5,0.8];
步骤3-2:由当前起点S构建A-B-C三段路径,且点A、S的距离小于或等于a*DS,点 A、B的距离小于或等于b*DS,点B、C的距离小于或等于c*DS,其中a∈[1,1.5],b∈[1,2], c∈[1,2];
取各段距离与所述DS的绝对差的总和最小时,对应的点A、B、C为正常分点,则A-B-C 三段路径包含的非正常分点为干扰点;
步骤3-3:将正常分点C作为当前起点,执行步骤3-2。
5.如权利要求4所述的方法,其特征在于,所述步骤3-2中,从A点开始确定A-B-C 三段路径。
6.如权利要求4或5所述的方法,其特征在于,设定参考分点间距DS为:取分布概率 最大的相邻间距为参考分点间距DS。
7.如权利要求4所述的方法,其特征在于,设定参考分点间距DS为:去掉相邻间距小 于预设值T1的左邻二级分点,然后去掉剩余二级分点的左端1/4的二级分点,再对剩下的点 二级分点通过直方图获取DS。
8.如权利要求1或2所述的方法,其特征在于,所述步骤4中,对初级切分点进行校准 为:对初级切分点、及其左右三个邻近像素点,分别计算字符高度,由最小字符高度所对应 的像素点作为当前初级切分点的切分位置,且优先选择靠近初级切分点的位置。
9.如权利要求3所述的方法,其特征在于,所述步骤4中,对初级切分点进行校准为: 对初级切分点、及其左右三个邻近像素点,分别计算字符高度,由最小字符高度所对应的像 素点作为当前初级切分点的切分位置,且优先选择靠近初级切分点的位置。
说 明 书
<p>技术领域
本发明涉及一种对紧连字串的字符分离方法,特别适用于各种真实票据中数字串的切分方法。
背景技术
票据作为目前生活工作中经常使用的工具,为了更加方便的将票据上的一些信息转化为数字信息进行后续的处理,通常会使用一些自动识别处理的方法。在识别字符之前的一个十分重要的步骤就是将待识别的字符串切分开。但是票据中复杂的背景信息,紧密粘连的字符,是目前各种切分方法都会面临的难题。因此,复杂环境中紧连字串的切分问题,具有很大的研究价值和应用前景。
目前常采用的切分方法有三种,第一种是水平投影法,即按照水平方向,计算垂直方向中投影的最低点,得到属于目标字符的分割位置,但是在复杂环境及紧连字串中,这种方法的可行性就大大降低,背景噪声以及粘连会影响投影分点切分的准确性,从而错误的计算出分点的位置。目前常采用的另一种方法是通过字符的连通性来进行字符的分割,即按照属于同一
个字符的像素构成一个连通区域的原则进行切分,这种方法对于车牌识别等字符分点清晰连通区域明显的情况十分实用,但是对于真实票据中的经常存在字符粘连的情况就不能适用,准确率很低。第三种,基于模板匹配的切割算法,根据字符串的结构和尺寸特征,设计了字符串模板,用这样的模板在车牌区域滑动匹配进行字符的切割确定最佳匹配位置,但是这种方法,对于各种票据中的各种不同的字体就会出现很大的问题,因为他只适用于一种字体,或是变化不大的不同字体。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论