专利名称:一种字符串处理方法及装置专利类型:发明专利
发明人:魏爱勇
申请号:CN201510103200.4
申请日:20150309
公开号:CN106033416A
字符串长度17模式串长度公开日:
20161019
专利内容由知识产权出版社提供
摘要:本申请公开了一种字符串处理方法,包括:获取待识别字符串;将所述待识别字符串进行分词,得到各待识别字符子串;确定各待识别字符子串的语义权重;依据各待识别字符子串,查目标字符串;将所述目标字符串进行分词,得到各目标字符子串;确定各目标字符子串的语义权重;依据各待识别字符子串和各目标字符子串的语义权重,确定待识别字符串与目标字符串之间的语义编辑距离;依据所述语义编辑距离,确定所述待识别字符串与目标字符串之间的相似度。本申请采用带语义权重的字符子串确定语义编辑距离,大大提升了字符串相似度识别的准确性,解决了现有字符串识别准确性较差的问题。本申请还公开了另一种字符串处理装置。
申请人:阿里巴巴集团控股有限公司
地址:英属开曼岛大开曼资本大厦一座四层847号邮箱
国籍:KY
代理机构:北京国昊天诚知识产权代理有限公司
代理人:许志勇
更多信息请下载全文后查看

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。