专利名称:一种Web环境下的字符串相似度的分析方法专利类型:发明专利
发明人:于戈,申德荣,朱命冬,寇月,聂铁铮,王振华
申请号:CN200910011738.7
申请日:20090527
公开号:CN101561813A
公开日:
20091021
专利内容由知识产权出版社提供
摘要:一种Web环境下的字符串相似度分析方法,首先定义基本操作代价;对字符串预处理,识别它的词首字符和去除非实意字符;创建距离矩阵,通过创建匹配索引实现编辑距离的优化;然后,判断缩写词,先判断两个字符串是否是缩写关系,如果是缩写关系则进行距离优化;其中,缩写关系由2个因素决定:①判断两者是否有相似度;②判断两者的词首字符是否被匹配;之后对缩写词距离优化,通过减少连续插入字符和连续删除字符的代价实现。本发明的字符串相似度分析方法能很好地处理web中经常出现的省略、缩写和字符顺序颠倒情况,具有较高适用性,在Web未知环境下,具有较高的匹配精度。
申请人:东北大学
地址:110004 辽宁省沈阳市和平区文化路3号巷11号
国籍:CN
代理机构:沈阳东大专利代理有限公司
代理人:李运萍
更多信息请下载全文后查看字符串长度可以用lenngtn吗js

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。