(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 113901806 A
(43)申请公布日 2022.01.07
(21)申请号 CN202111247073.7
(22)申请日 2021.10.26
(71)申请人 信雅达科技股份有限公司
    地址 310051 浙江省杭州市滨江区江南大道3888号信雅达科技大厦
(72)发明人 操玉琴 张姗 宣明辉 周鸿章
(74)专利代理机构 33289 杭州裕阳联合专利代理有限公司
    代理人 葛婷婕
(51)Int.CI
      G06F40/284(20200101)
      G06F40/30(20200101)
      G06N3/04(20060101)
      G06N3/08(20060101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      针对小规模数据集的多模型融合的质检方法
(57)摘要
      本发明公开了一种针对小规模数据集的多模型融合的质检方法,包含:将原始的对话数据集进行预处理得到文本数据集;将文本数据集进行处理得到其对应的词向量;对词向量进行转换得到其对应的特征向量;根据特征向量进行情绪预测;根据特征向量进行身份识别。本发明的针对小规模数据集的多模型融合的质检方法,采用针对小规模数据集的多模型融合的质检方法,能够实现用户所需得针对多视角文本多情绪检测任务,对于一句文本,模型可以检测出文本对应的角和所包含的情绪。避免客服因个人因素出现辱骂、讥讽客户的行为,及时处理客户的投诉诉求,提高用户体验。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-01-25
实质审查的生效
实质审查的生效
2022-01-07
公开
公开

权 利 要 求 说 明 书


1.一种针对小规模数据集的多模型融合的质检方法,其特征在于,包含以下步骤:

正则化英文将原始的对话数据集进行预处理得到文本数据集;

将所述文本数据集进行处理得到其对应的词向量;

对所述词向量进行转换得到其对应的特征向量;

根据所述特征向量进行情绪预测;

根据所述特征向量进行身份识别。



2.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述将所述文本数据集进行处理得到其对应的词向量的具体方法为:

将所述文本数据集输入到第一模型进行微调得到所述词向量。



3.根据权利要求2所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述第一模型为albert模型。



4.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述对所述词向量进行转换得到其对应的特征向量的具体方法为:

将所述词向量输入CNN模型。




5.根据权利要求4所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述CNN模型对所述词向量进行转换的方法为:

所述CNN模型对词向量进行卷积、激活和池化运算得到多维特征;

将得到的所述多维特征通过所述CNN模型的Flatten层转化成一维特征;

将所述一维特征经过所述CNN模型的全连接层得到所述特征向量。



6.根据权利要求5所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述CNN模型为textcnn模型。



7.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述根据所述特征向量进行情绪预测的具体方法为:

将所述特征向量输入softmax层中,使用softmax层进行情绪概率分类。



8.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

根据所述特征向量进行身份识别的具体方法为:

将所述特征向量输入决策树模型进行身份识别。



9.根据权利要求8所述的针对小规模数据集的多模型融合的质检方法,其特征在于,

所述决策树模型为xgboost模型。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。