专利名称:字符串相似度计算方法、装置、程序和存储媒体专利类型:发明专利
发明人:梅村恭司
申请号:CN02159822.3
申请日:20021227
公开号:CN1434400A
字符常量合法公开日:
20030806
专利内容由知识产权出版社提供
摘要:一种字符串相似度计算方法,通过选择相似度计算中使用的部分字符串,来进行文件检索的高速化。将输入字符串X和文件数据库的文件Y作为两个字符串,计算它们的相似度。首先,根据出现频度来选择从输入字符串切出的部分字符串,并记录在部分字符串管理表中。接着,对于部分字符串管理表内的各部分字符串,收集一致信息,并记录在一致信息管理表中。然后,取出有关文件Y的列表,计算与输入字符串X的相似度。将文件号码和相似度形成组并记录在文件管理表中。对所有的文件重复进行该处理。最后,以相似度高的顺序重新排列文件管理表,从数据库中选择相似度高的文件,作为检索结果。
申请人:住友电气工业株式会社,情报处理振兴事业协会
地址:日本大阪府
国籍:JP
代理机构:北京市柳沈律师事务所
更多信息请下载全文后查看
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论