(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 113901806 A (43)申请公布日 2022.01.07 | ||
(21)申请号 CN202111247073.7
(22)申请日 2021.10.26
(71)申请人 信雅达科技股份有限公司
地址 310051 浙江省杭州市滨江区江南大道3888号信雅达科技大厦
(72)发明人 操玉琴 张姗 宣明辉 周鸿章
(74)专利代理机构 33289 杭州裕阳联合专利代理有限公司
代理人 葛婷婕
(51)Int.CI
G06F40/284(20200101)
G06F40/30(20200101)
G06N3/04(20060101)
G06N3/08(20060101)
G06F40/30(20200101)
G06N3/04(20060101)
G06N3/08(20060101)
权利要求说明书 说明书 幅图 |
(54)发明名称
针对小规模数据集的多模型融合的质检方法 | |
(57)摘要
本发明公开了一种针对小规模数据集的多模型融合的质检方法,包含:将原始的对话数据集进行预处理得到文本数据集;将文本数据集进行处理得到其对应的词向量;对词向量进行转换得到其对应的特征向量;根据特征向量进行情绪预测;根据特征向量进行身份识别。本发明的针对小规模数据集的多模型融合的质检方法,采用针对小规模数据集的多模型融合的质检方法,能够实现用户所需得针对多视角文本多情绪检测任务,对于一句文本,模型可以检测出文本对应的角和所包含的情绪。避免客服因个人因素出现辱骂、讥讽客户的行为,及时处理客户的投诉诉求,提高用户体验。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-01-25 | 实质审查的生效 | 实质审查的生效 |
2022-01-07 | 公开 | 公开 |
权 利 要 求 说 明 书
1.一种针对小规模数据集的多模型融合的质检方法,其特征在于,包含以下步骤:
正则化英文将原始的对话数据集进行预处理得到文本数据集;
将所述文本数据集进行处理得到其对应的词向量;
对所述词向量进行转换得到其对应的特征向量;
根据所述特征向量进行情绪预测;
根据所述特征向量进行身份识别。
2.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述将所述文本数据集进行处理得到其对应的词向量的具体方法为:
将所述文本数据集进行处理得到其对应的词向量;
对所述词向量进行转换得到其对应的特征向量;
根据所述特征向量进行情绪预测;
根据所述特征向量进行身份识别。
2.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述将所述文本数据集进行处理得到其对应的词向量的具体方法为:
将所述文本数据集输入到第一模型进行微调得到所述词向量。
3.根据权利要求2所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述第一模型为albert模型。
4.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述对所述词向量进行转换得到其对应的特征向量的具体方法为:
将所述词向量输入CNN模型。
3.根据权利要求2所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述第一模型为albert模型。
4.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述对所述词向量进行转换得到其对应的特征向量的具体方法为:
将所述词向量输入CNN模型。
5.根据权利要求4所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述CNN模型对所述词向量进行转换的方法为:
所述CNN模型对词向量进行卷积、激活和池化运算得到多维特征;
将得到的所述多维特征通过所述CNN模型的Flatten层转化成一维特征;
将所述一维特征经过所述CNN模型的全连接层得到所述特征向量。
6.根据权利要求5所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述CNN模型为textcnn模型。
7.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述根据所述特征向量进行情绪预测的具体方法为:
将所述特征向量输入softmax层中,使用softmax层进行情绪概率分类。
8.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
根据所述特征向量进行身份识别的具体方法为:
7.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述根据所述特征向量进行情绪预测的具体方法为:
将所述特征向量输入softmax层中,使用softmax层进行情绪概率分类。
8.根据权利要求1所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
根据所述特征向量进行身份识别的具体方法为:
将所述特征向量输入决策树模型进行身份识别。
9.根据权利要求8所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述决策树模型为xgboost模型。
9.根据权利要求8所述的针对小规模数据集的多模型融合的质检方法,其特征在于,
所述决策树模型为xgboost模型。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论