专利名称:一种地址字符串的分词方法及装置专利类型:发明专利
发明人:侯建,黄峰,费春勇
申请号:CN202011522142.6
申请日:20201222
公开号:CN112256932A
公开日:
字符串截取几段方法
20210122
专利内容由知识产权出版社提供
摘要:本申请公开了一种地址字符串的分词方法及装置,根据基础地址库的数据,使用隐马尔可夫模型HMM对地址字符串进行状态预测;使用平滑优化算法提升状态预测的准确率;将概率最大的状态预测的结果转换为具体的地址信息。本申请以HMM模型作为基础,将长地址字符串视为一个观测序列,通过学习基础地址库中的状态转移规律,得出一个适用于中文地址分词标注的模型,并采用了平滑优化算法提升预测的准确率,计算结果可以得出该地址的状态序列,将概率最大的结果作为最终的地址分词方案,降低了人力时间成本,提升了效率。该方法不仅适用于电信领域的智能客服系统,还适用于其他具有地址分词相似场景的垂直领域。
申请人:中博信息技术研究院有限公司
地址:210000 江苏省南京市雨花台区小行尤家凹08号
国籍:CN
代理机构:常州佰业腾飞专利代理事务所(普通合伙)
代理人:张励
更多信息请下载全文后查看
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论