第16期2023年8月无线互联科技
Wireless Internet Technology
No.16August,2023
基金项目:项目名称:基于传染病动力学的异构社交网络动态谣言传播模式与干预策略研究;项目编号:XZ202001ZR0046G ㊂
作者简介:王菽裕(1991 ),男,甘肃天水人,讲师,硕士;研究方向:网络信息安全和深度学习㊂
基于Encoder -Decoder -Detector 的多任务
谣言检测模型
王菽裕,许晓宇
(西藏民族大学信息工程学院,陕西咸阳712082)
摘要:随着社交媒体的迅速发展,互联网已成为人们获取信息的主要平台㊂它尽管给人们带来了不少便利,但却也带来了谣言泛滥的问题㊂近年来,研究人员致力于应对这一挑战,采用从特征工程到深度学
习的各种方法㊂然而,现有工作中并未充分利用谣言本身的特征结构㊂文章提出了一种Encoder -Decoder -Detector (ED 2)多任务谣言检测模型,运用Encoder 模块充分提取文本和用户特征㊂该模型
采用GCN 和LSTM 模型对原文和评论文本进行编码,任务一是Decoder 模块恢复谣言传播特征,任务二是利用Detector 模块进行解析和判断谣言是否属实㊂在公开数据集上,ED 2模型实现了最佳表现㊂关键词:互联网;谣言检测;多任务中图分类号:TP314㊀㊀文献标志码:A 0㊀引言
㊀㊀随着科技的发展和社交媒体的扩张,谣言传播范围广泛,谣言检测也逐渐引起人们的广泛关注㊂早期使用手工制作特征的方法由于效率低下而被淘汰,近年来逐渐采用深度学习方法㊂
深度学习方法在谣言检测领域得到了广泛应用,可分为两类㊂第一类方法主要关注文本挖掘和学习文本语义特征㊂例如,早期的研究中,Jing 等[1-2]使用了递归神经网络(RNNs)包括LSTM 和GRU 来学习谣言检测中的说法表示㊂另外,Feng 等[3]通过使用卷积核提取文本中的特征训练卷积神经网络(CNNs)㊂据Huang 等[4]的研究表明,谣言和非谣言通过传播形成了不同的结构㊂
Lin 等[5]为了增强谣言检测模型的结构信息学习
能力,提出了一种获得文本㊁传播和结构信息的方法,由编码器㊁解码器和检测器3个部分组成㊂编码器采用高效的图卷积网络,将初始的文本信息视为输入,并通过传播来更新节点特征,从而学习文本
和传播信息㊂编码器生成的节点特征将被用于随后的解码器模块,该模块使用AutoEncoder 方法来学习整体的图结构信息㊂同时,检测器利用编码器的输出对谣言事
件进行分类㊂然而在编码器部分忽略了考虑谣言传播的时间特性㊂近年来,图神经网络的研究引起了人们的广泛关注,许多研究者提出了一些方法,其中GCN 对图结构的特征提取是最有效的㊂GCN 也在许多领域都有很好的应用,如蛋白质界面预测㊁文本分类和社区检测㊂某个问题是基于图或者节点之间的关系时,使用GCN 对图进行操作,可以更好地获得节点的高级特征㊂为了进一步提升谣言检测的准确率,改进Lin 等[5]中的特征提取模块,也就是在考虑谣言的静态全局结构特征的同时,还要考虑谣言传播的时间特性㊂在解码部分,涉及多任务模式完成谣言检测,任务一是完成谣言全局静态结构特征的恢复,任务二是完成谣言检测(是或者否)㊂本文主要贡献在于以下几点:
(1)提出了多任务谣言检测模型ED 2,任务一可
以直观观测谣言传播的全局结构特征;任务二实现谣言的检测㊂
(2)改进了谣言特征提取模块,一方面考虑全局结构特征,一方面考虑谣言传播时间特征㊂(3)在公开数据集上验证了所提模型的谣言检测准确率,能达到最好的效果㊂
1㊀问题定义及模型1.1㊀问题定义
㊀㊀谣言数据集定义为C ={c 1,c 2, ,c C }表示一组信息集合,其具有相应的标记Y ={y 1,y 2, ,y Y },其中|C |=|Y |㊂每一条信息c i 是由一组帖子组成,表
示为V ={v i 0,v i 1, ,v i n i -1},其中v i
0表示该帖子的信息
c i 源帖,源贴与其他转贴之间的关系表示为E ={e i mn |
m ,n =0,1, ,(n i -1)},通过该关系可以对应得到一个邻接矩阵定义为A ㊂该条信息c i 所对应的文本
特征表示为x i ={x i 0,x i 1, ,x i n i -1},其中每个x i 0是通过
TF -IDF 计算得到㊂
数据集具备相应的标签,通过监督学习的方式训练网络模型,模型输入和输出可以表示为:A
^,y ^i =F (c i ,V ,E ,A ,x i ,y i )(1)
1.2㊀模型
㊀㊀为了实现谣言检测,笔者设计了如图1所示的多
任务谣言检测模型ED 2,共包括3个模块㊂Encoder
模块,用于实现谣言信息的特征提取,该模块的设计思想是通过改进前人模型,主要区别在于考虑全局静态结构特征提取的同时,还需要考虑时序特征提取,为此引入第二分支LSTM 用来实现该目标㊂两个分支提取的特征具有相同的形状,通过级联操作拼接为中间特征㊂中间特征将用于后续两个模块的输入,也就是实现两个子任务㊂分别是谣言结构恢复模块Decoder,该模块通过将中间特征转置再与中间特征进行点乘操作,得到的特征向量经过激活函数恢复可表示信息全局结构特征的邻接矩阵A ㊂任务二是谣言检测模块Detector,中间特征经过最大池化和平均池化操作,将两者的输出进行拼接,依次输入到全连接层和激活层得到谣言检测的判断
图1㊀多任务谣言检测模型ED 2
㊀㊀Encoder 模块㊂设初始输入x i 表示一个帖子,该帖子用TF -IDF 表示为固定词汇表中的单词向量㊂A 为邻接矩阵,表示帖子之间的关系㊂分支一中使用原始GCN 论文中使用的1stChebNet 方法,GCN 通过聚合邻居的特征来更新节点特征㊂它对信息流如何通过传播从源帖流向当前节点进行建模㊂单层GCN 一般效果较差,因此该模块结构采用两层GCN 来增强学习能力,公式如下:
H 1=GCN(x i ,A)(2)H 2=GCN(H 1,A)
(3)分支二中使用原始LSTM 结构,用于提取时序特征,具体可以表示为:
M =LSTM(x i )
(4)
因为H 2和M 具有相同的形状,通过拼接两个特
征向量得到中间特征Z ㊂
Decoder 模块㊂该模块主要是用于恢复谣言传播
全局结构特征,可以监督特征提取模块更好地提取到既能反映谣言传播结构又能反映谣言传播时间上的中间特征Z ㊂该模块用公式表示为:
A ^=D 1
(Z ㊃Z T )(5)
Detector 模块㊂检测器模块以中间特征作为输
入,目的是将事件分类为细粒度标签㊂该模块采用最大池化和均值池化运算将所有节点信息聚合为事件表示㊂其公式为:
y
^i =D 2(Maxpool (Z )+Meanpool (Z ))(6)
2㊀实验
㊀㊀本节介绍实验中使用的微博数据集,将提出的模型ED 2与基线模型VAE -GCN 进行比较㊂与其比较
的基线模型是VAE -GCN,用GCN 作为编码器,变分
GAE 作为解码器㊂实验结果如表1所示㊂
表1㊀谣言检测在微博上性能比较
方法分类准确率精度召回率F1
VAE -GCN F T 0.9440.9680.9170.9210.9640.9400.936ED
2
F T
0.951
0.9700.922
0.9350.970
0.9400.933
表1显示了两个模型在微博数据集上的性能㊂本文提出的模型ED 2
在4个指标上基本得到了提升㊂其原因主要在于特征提取模块考虑了提取双重特征,即全局结构特征和传播时序特征㊂ED 2模型使用GCN 通过传播来更新节点的表示㊂由于频谱卷积方法在图数据上具有较高的准确率,实验结果表明,ED
2
可以学习到更高层次㊁更好的特征表示方法㊂结合结构表示,ED 2
模型更加关注传播的最终全局结果,这有助于进一步提升谣言检测的性能㊂3 结语
㊀㊀谣言和非谣言具有明显的全局结构特征的区别,且谣言传播具有时序特征,ED 2模型在特征提取阶段考虑了提取双重特征,在微博数据上的实验结果表明,ED 2模型提高了谣言检测性能,并且优于最先进
的基线模型VAE -GCN㊂
参考文献
[1]JING M ,WEI G ,MITRA P ,et al.Detecting rumors
from microblogs with recurrent neural networks [C ].New
York :International Joint Conference on Artificial Intelligence ,2016.[2]李悦晨,钱玲飞,马静.基于BERT -RCNN 模型的微博谣言早期检测研究[J ].情报理论与实践,2021(7):173-177.
[3]FENG Y ,QIANG L ,SHU W ,et al.A convolutional
approach
for
misinformationdecoder
identification [C ].
Melbourne :International Joint Conference on Artificial
Intelligence ,2017.
[4]HUANG Q ,ZHOU C ,WU J ,et al.Deep structure
learning for rumor detection on twitter [C ].Budapest :
International Joint Conference on Neural Networks ,2019.
[5]LIN H ,ZHANG X ,FU X .A graph convolutional encoder and decoder model for rumor detection [C ].
Sydney :International Conference on Data Science and Advanced Analytics ,2020.
(编辑㊀沈㊀强)
A multi -task rumor detection model based on Encoder -Decoder -Detector
Wang Shuyu Xu Xiaoyu
School of Information Engineering Xizang Minzu University Xianyang 712082 China
Abstract With the rapid development of social media the Internet has become the primary platform for people to
access information.While it has brought great convenience to people s lives it has also brought the problem of rampant rumors.Research has been devoted to addressing this challenge using various methods ranging from feature
engineering to deep learning.However current work has not fully utilized the structural features of rumors themselves.
This paper proposes an Encoder -Decoder -Detector  ED 2 multitask rumor detection model that utilizes the Encoder module to extract text and user features fully.The GCN and LSTM models are employed to encode the original text and the comment text respectively.Task one involves using the Dencoder module to restore the rumor propagation
characteristics and combining it with the Detector module to analyze and judge the veracity of the rumors.On publicly
available datasets the ED 2model achieved the best performance.
Key words internet rumor detection multitask

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。