(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | 字符串长度17模式串长度8 | |
(10)申请公布号 CN 103077389 A (43)申请公布日 2013.05.01 | ||
(21)申请号 CN201310004707.5
(22)申请日 2013.01.07
(71)申请人 华中科技大学
地址 430074 湖北省武汉市洪山区珞喻路1037号
(72)发明人 白翔 姚聪 蔡超 刘文予
(74)专利代理机构 华中科技大学专利中心
代理人 李智
(51)Int.CI
G06K9/20
G06K9/62
权利要求说明书 说明书 幅图 |
(54)发明名称
一种结合字符级分类和字符串级分类的文本检测和识别方法 | |
(57)摘要
本发明公开了一种结合字符级和字符串级分类的文本检测和识别方法,在图像中提取可能属于同一字符的像素集形成备选字符;滤除不满足字符几何特征统计规律的备选字符;采用基于字符旋转和尺度不变性特征的字符级分类器对备选字符分类,以确定备选字符为某字符的概率;将字符两两合并形成初始字符串;计算两两字符串间的相似度,将相似度最高的两字符串合并成新的字符串,直到没有可再合并的字符串;采用基于字符串结构特征的字符串级分类器对字符串分类,以确认具有语意的字符串;利用待识别字符为某一字符的概率对字符串识别,得到语意文本。本发明将文本检测和识别过程作为一个整体,利用检测和识别的相互作用提高结果精度,简单高效。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
权 利 要 求 说 明 书
1.一种结合字符级和字符串级分类的文本检测和识别方法,包括以下 步骤:
(1)依据字符的组成像素中相邻像素的笔画宽度相同或相近的规律, 在输入图像中提取可能属于同一字符的像素集形成备选字符;
(2)滤除不满足字符几何特征统计规律的备选字符;
(3)采用基于字符旋转和尺度不变性特征的字符级分类器对步骤(2) 保留的备选字符进行分类,以确定备选字符是否为字符以及为某字符的字 符分布概率,记被确定为字符的备选字符为待识别字符;
(4)在步骤(3)确定的待识别字符中,将字符笔画宽度、尺度和颜 相同或相近以及间距小于两字符尺度之和的两字符进行合并,形成多个 由两字符构成的初始字符串;计算两两字符串间的相似度,将相似度最高 的两个字符串合并成一个新的字符串,重新计算合并后存在的两两字符串 间的相似度,以此类推,直到没有可再合并的字符串,最终得到的字符串 即为备选字符串;
(5)采用基于字符串结构特征的字符串级分类器对备选字符串进行分 类,以确认具有实际语意的备选字符串为待识别字符串;
(6)利用步骤(3)得到的字符分布概率对待识别字符串进行识别, 最终得到语意文本。
2.根据权利要求1所述的文本检测和识别方法,其特征在于,所述 步骤(2)中的字符几何特征统计规律具体为:字符c的宽度WV(c)变化范围 为[0,1],高宽比AR(c)变化范围为[0.1,1],占空比OR(c)变化范围为 [0.1,1],其中,<maths><math><mrow><mi>WV</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>σ</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow><mrow
><mi>μ</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math></maths><maths><math><mrow><mi>Ar</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mi>min</mi><mo>{</mo><mfrac><mrow><mi>w</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow><mrow><mi>h</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mfrac><mrow><mi>h</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow><mrow><mi>w</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>}</mo><mo>,</mo></mrow></math></maths><maths><math><mrow><mi>OR</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mi>q</mi><mrow><mi>w</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>*</mo><mi>h</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math></maths>σ(c)为字符c的像素笔画宽度标准方差,μ(c)为字符c的像素笔画宽度均值, w(c)为字符c的宽度,h(c)为字符c的高度,q为字符c的组成像素个数。
3.根据权利要求1所述的文本检测和识别方法,其特征在于,所述步 骤(3)中基于字
符旋转和尺度不变性特征的字符级分类器构建方法具体为:
(31)提取训练样本字符c的基本信息,包括重心o(c)、长轴L(c)、短 轴l(c)以及方向θ(c),进而确定备选字符c的中心O(c)=o(c)、特征尺度 S(c)=L(c)+l(c)和主方向Θ(c)=θ(c);
(32)提取训练样本字符的训练特征:首先,定义带参考方向的简略 圆形特征模板和精细圆形特征模板;然后,基于上述模板定义旋转和尺度 不变性特征,包括字符轮廓形状、字符边缘形状、字符占空比、字符轴比、 字符宽度变化和字符密度;接着,将训练样本字符的中心分别与两特征模 板中心重合,保持其主方向与对应特征模板的参考方向一致,并将训练样 本字符缩放到对应特征模板的尺度;在对应特征模板中,将训练样本字符 的梯度方向旋转Θ(c)角度并将其梯度方向归一化到[0,π],利用字符的基本 信息计算六个方向的旋转和尺度不变性特征;最后,分别在每一个特征模 板中,针对每一个方向,将模板中所有扇形区内字符的同一特征组合为一 个特征描述子,最终得到轮廓形状描述子、边缘形状描述子、占空比描述 子、轴比描述子、宽度变化描述子和密度描述子;
(33)利用训练样本字符的训练特征训练得到字符级分类器。
4.根据权利要求1所述的文本检测和识别方法,其特征在于,所述步 骤(4)中的相似度计算方法为:
相似度s(C<sub>1</sub>,C<sub>2</sub>)=w*s<sub>o</sub>(C<sub>1</sub>,C<sub>2</sub>)+(1-w)*s<sub>p</sub>(C<sub>1</sub>,C<sub>2</sub>),
其中,
γ(C<sub>1</sub>,C<sub>2</sub>)表示字符串C<sub>1</sub>与C<sub>2</sub>的夹角,nC<sub>1</sub>和nC<sub>2</sub>分别表示C<sub>1</sub>和C<sub>2</sub>包含的字 符数,参数w的取值范围[0,1]。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论