专利名称:一种结合字符级分类和字符串级分类的文本检测和识别方法
专利类型:发明专利
发明人:白翔,姚聪,蔡超,刘文予
申请号:CN201310004707.5
申请日:20130107
公开号:CN103077389A
公开日:
20130501
专利内容由知识产权出版社提供
摘要:本发明公开了一种结合字符级和字符串级分类的文本检测和识别方法,在图像中提取可能属于同一字符的像素集形成备选字符;滤除不满足字符几何特征统计规律的备选字符;采用基于字符旋转和尺度不变性特征的字符级分类器对备选字符分类,以确定备选字符为某字符的概率;将字符两两合并形成初始字符串;计算两两字符串间的相似度,将相似度最高的两字符串合并成新的字符串,直到没有可再合并的字符串;采用基于字符串结构特征的字符串级分类器对字符串分类,以确认具有语意的字符串;利用待识别字符为某一字符的概率对字符串识别,得到语意文本。本发明将文本检测和识别过程作为一个整体,利用检测和识别的相互作用提高结果精度,简单高效。
申请人:华中科技大学
地址:430074 湖北省武汉市洪山区珞喻路1037号
国籍:CN
字符串长度怎么判断代理机构:华中科技大学专利中心
代理人:李智
更多信息请下载全文后查看

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。