一种基于网络表示学习的miRNA-疾病关联预测方法--688IT编程网

收稿日期：２０２００７０２；修回日期：２０２００８２７基金项目：国家自然科学基金—青年基金资助项目（６１７０２２２９）；江苏省六大人才高峰项目（２０１６ＸＹＤＸＸＪＳ０８６）

作者简介：耿霞（１９７８），女，山西汾阳人，副教授，硕导，博士研究生，主要研究方向为人工智能、模式识别、生物信息学（ｇｅｎｇｘｉａ＠ｕｊｓ．ｅｄｕ．ｃｎ）；韩凯健（１９９６），男，江苏南通人，硕士研究生，主要研究方向为人工智能、生物信息学．

一种基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法

耿　霞，韩凯健

（江苏大学计算机科学与通信工程学院，江苏镇江２１２０１３）

摘　要：针对ｍｉＲＮＡ疾病关联研究中信息使用不充分、过于依赖网络中节点的相似度信息以及预测准确度较

低的问题，提出一种基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法（ｎｅｔｗｏｒｋｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｉＲＮＡ

ｄｉｓｅａｓｅａｓｓｏｃｉａｔｉｏｎ

，ＮＲＬＭＤＡ）。该方法通过引入长链非编码ＲＮＡ（ｌｎｃＲＮＡ）构造出ｍｉＲＮＡｌｎｃＲＮＡ疾病异构网络，丰富原有网络的生物学信息；采用网络表征学习ｎｏｄｅ２ｖｅｃ算法在上述提出的异构网络中以一定的游走策略获得节

点的近邻序列，并通过ｓ

ｋｉｐｇｒａｍ模型进行深度学习，从而获得节点的低维特征向量；最后基于ｍｉＲＮＡｍｉＲＮＡ相似性的关联规则推断方法预测ｍｉＲＮＡ与疾病的关联。该方法能够挖掘出全局网络的拓扑结构特征，并且不需要负样本。ＮＲＬＭＤＡ在留一交叉验证和五折交叉验证以及进一步的案例研究上的实验结果优于经典方法。关键词：ｍｉＲＮＡ；ｎｏｄｅ２ｖｅｃ算法；ｓｋｉｐｇｒａｍ模型中图分类号：ＴＰ３９１　文献标志码：Ａ　文章编号：１００１３６９５（２０２１）０５０１５１３６５０６ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０２０．０７．０１７６

ｍｉＲＮＡｄｉｓｅａｓｅａｓｓｏｃｉａｔｉｏｎｐｒｅｄｉｃｔｉｏｎｂａｓｅｄｏｎ

ｎｅｔｗｏｒｋｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｅｔｈｏｄ

ＧｅｎｇＸｉａ，ＨａｎＫａｉｊｉａｎ

（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ＆ＣｏｍｍｕｎｉｃａｔｉｏｎＥｎｇｉｎｅｅ

ｒｉｎｇ，ＪｉａｎｇｓｕＵｎｉｖｅｒｓｉｔｙ，ＺｈｅｎｊｉａｎｇＪｉａｎｇｓｕ２１２０１３，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｉｎｖｉｅｗｏｆｔｈｅｐｒｏｂｌｅｍｏｆｉｎａｄｅｑｕａｔｅｕｓｅｏｆｉｎｆｏｒｍａｔｉｏｎ，ｅｘｃｅｓｓｉｖｅｄｅｐｅｎｄｅｎｃｅｏｎｓｉｍｉｌａｒｉｔｙｉｎｆｏｒｍａｔｉｏｎｏｆｎｏｄｅｓｉｎ

ｔｈｅｎｅｔｗｏｒｋａｎｄｌｏｗｐｒｅｄｉｃｔｉｏｎａｃｃｕｒａｃｙｉｎｍｉＲＮＡｄｉｓｅａｓｅａｓｓｏｃｉａｔｉｏｎｓｔｕｄｉｅｓ

，ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｍｉＲＮＡｄｉｓｅａｓｅａｓｓｏｃｉａｔｉｏｎｐｒｅｄｉｃｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎｎｅｔｗｏｒｋｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇ（

ＮＲＬＭＤＡ：ｎｅｔｗｏｒｋｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｉＲＮＡｄｉｓｅａｓｅａｓｓｏｃｉａｔｉｏｎ）．ＴｈｉｓｍｅｔｈｏｄｃｏｎｓｔｒｕｃｔｅｄａｍｉＲＮＡｌｎｃＲＮＡｄｉｓｅａｓｅｈｅｔｅｒｏｇｅｎｅｏｕｓｎｅｔｗｏｒｋｂｙｉｎｔｒｏｄｕｃｉｎｇｌｏｎｇｃｈａｉｎｎｏｎｃｏｄｉｎｇ

ＲＮＡ（ｌｎｃＲＮＡ），ｗｈｉｃｈｅｎｒｉｃｈｅｄｔｈｅｂｉｏｌｏｇｉｃａｌｉｎｆｏｒｍａｔｉｏｎｏｆｔｈｅｏｒｉｇｉｎａｌｎｅｔｗｏｒｋ．Ｉｔｕｓｅｄｔｈｅｎｅｔｗｏｒｋｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｎｏｄｅ２ｖｅｃａｌｇｏｒｉｔｈｍｉｎｔｈｅｈｅｔｅｒｏｇｅｎｅｏｕｓｎｅｔｗｏｒｋｐｒｏｐｏｓｅｄａｂｏｖｅｔｏｏｂｔａｉｎｔｈｅｎｏｄｅ’ｓｎｅｉｇｈｂｏｒｉｎｇｓｅｑｕｅｎｃｅｗｉｔｈａｃｅｒｔａｉｎ

ｗａｌｋｉｎｇｓｔｒａｔｅｇｙ

，ａｎｄｐｅｒｆｏｒｍｅｄｄｅｅｐｌｅａｒｎｉｎｇｔｈｒｏｕｇｈｔｈｅｓｋｉｐｇｒａｍｍｏｄｅｌｔｏｏｂｔａｉｎｔｈｅｌｏｗｄｉｍｅｎｓｉｏｎａｌｆｅａｔｕｒｅｖｅｃｔｏｒｓｏｆｔｈｅｎｏｄｅ．Ｆｉｎａｌｌｙ，ｔｈｅａｓｓｏｃｉａｔｉｏｎｒｕｌｅｉｎｆｅｒｅｎｃｅｍｅｔｈｏｄｂａｓｅｄｏｎｍｉＲＮＡｍｉＲＮＡｓｉｍｉｌａｒｉｔｙｐｒｅｄｉｃｔｅｄｔｈｅａｓｓｏｃｉａｔｉｏｎｂｅｔｗｅｅｎｍｉＲＮＡａｎｄｄｉｓｅａｓｅ．Ｔｈｉｓｍｅｔｈｏｄｃｏｕｌｄｍｉｎｅｔｈｅｔｏｐｏｌｏｇｉｃａｌｓｔｒｕｃｔｕｒｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｔｈｅｇｌｏｂａｌｎｅｔｗｏｒｋｗｉｔｈｏｕｔｎｅｇａｔｉｖｅ

ｓａｍｐｌｅｓ．ＮＲＬＭＤＡ

’ｓｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｏｎｌｅａｖｅｏｎｅｏｕｔｃｒｏｓｓｖａｌｉｄａ

ｔｉｏｎａｎｄｆｉｖｅｆｏｌｄｃｒｏｓｓｖａｌｉｄａｔｉｏｎａｓｗｅｌｌａｓｃａｓｅｓｔｕｄｉｅｓａｒｅｓｕｐｅｒｉｏｒｔｏｔｈｅｃｌａｓｓｉｃａｌｍｅｔｈｏｄｓ．Ｋｅｙｗｏｒｄｓ：ｍｉＲＮＡ；ｎｏｄｅ２ｖｅｃａｌｇｏｒｉｔｈｍ；ｓｋｉｐｇｒａｍｍｏｄｅｌ

０　引言

ｍｉＲＮＡ疾病关联预测通常需要计算ｍｉＲＮＡ功能相似性和疾病语义相似性，采用邻接矩阵的方法来表示ｍｉＲＮＡ疾病网络。目前已经提出了许多方法用于相似性计算，Ｗａｎｇ等

人［１］

通过度量与两个ｍｉＲＮＡ相关的两组疾病间的语义相似性，评估两个ｍｉＲＮＡ间的功能相似性。Ｘｕａｎ等人［２］在此基础

上对于在有向无环图中共享更多公共部分的两种疾病分配较高的语义贡献值。基于相似度计算预测ｍｉＲＮＡ疾病关联的方法都是基于某个角度来定义同种节点的关系，构建网络模型所用数据单一，而且得到的相似度矩阵往往是一个稀疏矩阵，预测效果依赖节点相似性度量的准确性。基于机器学习的方法一般是通过提取ｍｉＲＮＡ疾病关联对的特征信息，主要将ｍｉＲＮＡ与疾病的相似性得分值作为特征，送入分类器对模型进行训练，最后用训练好的模型预测潜在的ｍｉＲＮＡ疾病关联。

例如，Ｆｕ等人［３］利用堆叠自动编码器从相似度矩阵中提取高

级特征，基于三层神经网络进行预测。Ｃ

ｈｅｎ等人［４］

基于过滤的方法从ｍｉＲＮＡ疾病关联特征集中筛选特征，使用随机森林

进行预测。然而，基于机器学习的方法通常无法保留ｍ

ｉＲＮＡ疾病网络的拓扑特征，并且需要负样本。未知关联关系可能只是暂时没有被验证发现，因此将这些未知关联关系作为反例不够合理。

ｍｉＲＮＡ疾病关联预测本质上是一个网络中节点链路的预测问题。网络表示学习通过相关算法将网络中的节点用一个低维的向量空间表示，能够保持原有网络的相关结构和特征，完成节点分类、链路预测等任务，已经广泛应用于生物信息学

领域。Ｚｈａｎｇ等人［５］

基于网络表示学习ｄｅｅｐｗａｌｋ算法挖掘网

络拓扑特征用于预测ｌ

ｎｃＲＮＡ疾病关联。毛宇薇［６］

使用网络学习用于蛋白质交互识别。网络表示学习可以将网络信息转换成低维向量，学习到网络的拓扑特征。

本文结合网络表示学习的方法，提出了一种基于网络表示学习算法ＮＲＬＭＤＡ预测ｍｉＲＮＡ疾病关联。首先，针对其他网络模型所用数据单一的问题，通过在原有ｍｉＲＮＡ疾病异构

第３８卷第５期２０２１年５月　计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓＶｏｌ３８Ｎｏ５

Ｍａｙ２０２１

网络中添加长链非编码ＲＮＡ（ｌｎｃＲＮＡ）节点，丰富网络的生物

学信息；然后采用ｎ

ｏｄｅ２ｖｅｃ算法［７］

在异构网络中进行有偏置的随机游走获得节点的近邻序列，并采用深度学习模型ｓｋｉｐ正则化正交匹配追踪

ｇｒａｍ获得节点的低维向量表示；

最后基于ｍｉＲＮＡ相似性的推断方法，计算疾病ｍｉＲＮＡ连接分数，发现潜在的ｍｉＲＮＡ疾病关联关系。该方法不仅保留了原有节点的相似度特征，而且极大程度地获得了网络的拓扑结构特征，提高了预测性能。

１　ｍｉＲＮＡ疾病异构网络

ｍｉＲＮＡ疾病异构网络包含ｍｉＲＮＡ相似性网络、疾病相似

性网络以及ｍ

ｉＲＮＡ疾病关联网络。ｍｉＲＮＡ相似性网络以及疾病相似性网络可以由相似度矩阵计算得到。１１　疾病相似性

疾病语义信息来自ＭｅＳＨ［８］

中的疾病语义描述，该数据库

提供一个严格的疾病分类系统。本文依据Ｗａ

ｎｇ等人［１］

的方法构建有向无环图（

ＤＡＧ）来计算疾病之间的语义相似性。疾病ｔ对由疾病Ａ的ＤＡＧ（Ａ）的语义计算如式（１）所示。

ＤＡ

（ｔ）＝１ｉｆｔ＝Ａ

ｍａｘ｛Δ ＤＡ

（ｔ′）｜ｔ′∈ｃｈｉｌｄｒｅｎｏｆｔ｝ｉｆｔ≠{

Ａ（１）

其中：参数Δ表示疾病ｔ与子节点ｔ′直接有向边的语义贡献因子。

按照式（２）定义疾病Ａ的语义值。两种疾病的ＤＡＧ图的

重叠部分越多，则两者相似性越高。然后依据式（

３）计算出疾病Ａ与Ｂ的语义相似性。

ＤＶ（Ａ）＝∑ｔ∈ＴＡ

ＤＡ

（ｔ）（２）ＳＤ（Ａ，Ｂ）＝

∑ｔ∈ＴＡ∩ＴＢ

（ＤＡ（ｔ）＋ＤＢ（ｔ））ＤＶ（Ａ）＋ＤＶ（Ｂ）

（３）

１２　ｍｉＲＮＡ相似性

Ｗａｎｇ通过度量与两个ｍｉＲＮＡ相关的两组疾病间的语义

相似性，评估两个ｍ

ｉＲＮＡ间的功能相似性。假设某一个疾病为ｄｔ，疾病集合用ＤＴ来标志，ＤＴ＝｛ｄｔ１，ｄｔ２，ｄｔ３，…，ｄｔｋ３｝，ＳＤ（ｄｔ，ＤＴ）代表疾病ｄｔ与疾病集合ＤＴ中疾病相似度的最大

值，如式（

４）所示。ｍ（ｉ）和ｍ（ｊ）的相似性可以由式（５）计算得到。

ＳＤ（ｄｔ，ＤＴ）＝ｍａｘ１≤ｉ≤ｋ

｛ＳＤ（ｄｔ，ｄｔｉ

）｝（４）

Ｓ（ｍ（ｉ），ｍ（ｊ））＝

∑１≤ｉ≤ｍＳＤ（ｄｔ１ｉ，ＤＴ２）＋∑１≤ｊ≤ｎ

ＳＤ（ｄｔ２ｊ，ＤＴ１）ｍ＋ｎ

（５）

其中：ｍ、ｎ分别表示ＤＴ２和ＤＴ１中疾病的数目。１３　ｍｉＲＮＡ疾病关联

本文从数据库ＨＭＤＤＶ２．０下载了人类ｍｉＲＮＡ与疾病的

关联数据，该数据库包含５４

３０种经实验证实的ｍｉＲＮＡ与疾病的关联，包括４９５种ｍｉＲＮＡ和３８３种疾病。本文用矩阵Ａ来表示ｍｉＲＮＡ疾病关联网络的邻接矩阵。如果第ｉ个ｍｉＲＮＡ与第ｊ个疾病的关联性确定，则将元素Ａ（ｉ，ｊ）分配为１，否则为０。详细数据如表１所示。

表１　数据集描述

Ｔａｂ．１　Ｄａｔａｓｅｔｄｅｓｃｒｉｐｔｉｏｎ

数据类型数量ｍｉＲＮＡ４９５疾病３８３ｍｉＲＮＡ

疾病关联５４３０

１４　网络结构改进

在ｍｉＲＮＡ疾病关联预测问题中，异构网络中一般只有

ｍｉＲＮＡ和疾病数据，而不包含长链非编码ＲＮＡ。长链非编码

ＲＮＡ与ｍｉＲＮＡ同属于非编码ＲＮＡ。近年来，研究人员发现长

链非编码Ｒ

ＮＡ的异常表达与癌症、神经系统疾病有关。与ｍｉＲＮＡ相比，长链非编码ＲＮＡ序列更长、结构更复杂，并且某

些长链非编码Ｒ

ＮＡ与ｍｉＲＮＡ间可以相互作用，参与细胞分化和个体发育调控等过程。ＬｎｃＲＮＡＤｉｓｅａｓｅ［９］

数据库收集和整理了大约４８０个经过实验验证的ｌｎｃＲＮＡ疾病关联，其中含有１６６个疾病。通过对数据库中疾病和ｌｎｃＲＮＡ进行过滤，只保

留属于人类的ｌ

ｎｃＲＮＡ疾病关联，最后得到包含３７１个长链非编码Ｒ

ＮＡ疾病关联，１０８种长链非编码ＲＮＡ和１４０种疾病。ｌｎｃＲＮＡ与ｍｉＲＮＡ之间的相互作用可以从ＳｔａｒＢａｓｅ［１０］

数据库（ｈｔｔｐ：／／ｓｔａｒｂａｓｅ．ｓｙｓｕ．ｅｄｕ．ｃｎ／ｍｉｒＬｎｃＲＮＡ．ｐｈｐ）获得，包含１１２７个ｌｎｃＲＮＡ和２７７个ｍｉＲＮＡ之间的１０１９８种相互作用。

对于长链非编码ＲＮＡ相似性的计算，采用Ｃｈｅｎ等人［１１］

在ｌｎｃＲＮＡ疾病关联预测中所使用的方法。

本文在传统的ｍｉＲＮＡ疾病网络中整合了长链非编码ＲＮＡ数据，通过引入长链非编码ＲＮＡ与疾病关联、长链非编码ＲＮＡ与ｍｉＲＮＡ相互作用以及长链非编码ＲＮＡ相似性进一

步丰富原有的生物网络，构建出ｍ

ｉＲＮＡｌｎｃＲＮＡ疾病异构网络，该网络一共由六部分构成，分别是疾病相似性网络、ｍｉＲＮ

Ａ相似性网络、已知的ｍｉＲＮＡ疾病关联网络、长链非编码ＲＮＡ与疾病关联、长链非编码ＲＮＡ与ｍｉＲＮＡ相互作用以及长链非

编码Ｒ

ＮＡ相似性网络。异构网络如图１

所示。图１　ｍｉＲＮＡｌｎｃＲＮＡ疾病异构网络

Ｆｉｇ．１　ＨｅｔｅｒｏｇｅｎｅｏｕｓｎｅｔｗｏｒｋｏｆｍｉＲＮＡｌｎｃＲＮＡｄｉｓｅａｓｅ

首先构建疾病相似性网络，该网络通过连接任意两个语义

相似性大于０的疾病构建。本文用一个无向带权图来抽象表示该网络的拓扑结构以及网络中疾病节点间的内在关系，ＧＤ＝（ＶＤ，ＥＤ，ＷＤ）。图中每个节点ｖｄ∈ＶＤ都表示一个疾病实体，每条边ｅｄ∈ＥＤ连接两个语义相似性大于０的疾病实体。边上的权重ｗｄ

∈ＷＤ表示两个疾病节点的语义相似度。ｍｉＲＮＡ相似性网络以及ｌｎｃＲＮＡ相似性网络的构建与疾病相似性网络类似。以ｍｉＲＮＡ相似性网络为例，该网络的拓扑结构以及网络中ｍｉＲＮＡ节点间

的内在关系通过无向带权图ＧＭ＝（ＶＭ，ＥＭ，ＷＭ）表示。如果两个ｍｉＲＮＡ实体间存在连接边ｅｍ∈ＥＭ，则表明两者存在相似性，边上的权重ｗｍ∈ＷＭ表示两

个ｍｉＲＮＡ实体的功能相似度。ｌｎｃＲＮＡ与疾病关联网络、ｌｎｃＲＮＡ与ｍｉＲＮＡ相互作用网络、

ｍｉＲＮＡ疾病关联网络的构建是基于已知的关联，如果两者之间经生物实验验证证实存在关联或者存在相互作用关系，则两个节点之间有边相连。

２　基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法

本文创新性地提出了一种基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法ＮＲＬＭＤＡ，下面给出了基本框架及相应的算法描述。

２１　ｍｉＲＮＡ疾病关联预测方法基本框架

本方法分为以下几个部分：ａ）整合ｍｉＲＮＡ、疾病、ｌｎｃＲＮＡ

·６６３１·计算机应用研究　第３８卷

相关数据构建异构网络，包含疾病相似网络、ｍｉＲＮＡ相似网

络、

ｌｎｃＲＮＡ相似性网络、ｍｉＲＮＡ疾病关联网络、ｌｎｃＲＮＡ疾病关联网络和ｌｎｃＲＮＡｍｉＲＮＡ相互作用网络；ｂ）基于网络表示学

习ｎｏｄｅ２ｖｅｃ算法在网络中提取节点的特征；ｃ）根据节点的特征向量，重新计算ｍｉＲＮＡｍｉＲＮＡ的相似性得分；ｄ）通过基于关联规则的推断方法，利用ｍｉＲＮＡ之间的相似性，发现潜在的ｍｉＲＮＡ疾病关联。ｍｉＲＮＡ疾病关联预测方法的基本框架如图２

所示。

图２　ｍｉＲＮＡ疾病预测方法的基本框架

Ｆｉｇ．２　ＢａｓｉｃｆｒａｍｅｗｏｒｋｏｆｍｉＲＮＡｄｉｓｅａｓｅｐｒｅｄｉｃｔｉｏｎ

１）异构网络的构建　具体的构建方法见１．４节，这里不再

赘述。

２）节点的向量化表示　本文选用网络表示学习中的ｎｏｄｅ２ｖｅｃ算法对ｍｉＲＮＡｌｎｃＲＮＡ疾病异构网络中的节点进行矢量化表示，学习网络中节点的拓扑特征。不同于经典Ｄｅｅｐ

ｗａｌｋ

算法随机选择下一个邻接点，ｎｏｄｅ２ｖｅｃ算法通过引入ｐ、ｑ两个超参数来指导随机游走过程，可以平衡采样的深度和宽度。具体来说，对于ｍｉＲＮＡ、长链非编码ＲＮＡ、疾病关联网络，采用ＢＦＳ有助于探索ｍｉＲＮＡ相似性网络、疾病相似性和ｌｎｃＲＮＡ相似性网络的同质性。采用ＤＦＳ有助于发现ｍｉＲＮＡ疾病关联网络、长链非编码ＲＮＡ疾病关联网络和长链非编码ＲＮＡｍｉＲＮＡ相互作用网络的结构相似性。

通过使用ｎ

ｏｄｅ２ｖｅｃ算法计算包括ｍｉＲＮＡ和疾病在内的所有节点的向量表示。ｎ

ｏｄｅ２ｖｅｃ算法主要由两个部分组成：ａ）采样获取节点序列。有偏随机游走获取顶点的近邻序列，通过超参数ｐ和ｑ来控制随机游走的策略，对于每一个节点ｕ，随机游走生成器为其生成长度为１的ｒ个随机游走序列；ｂ）节点序列通过深度学习ｓｋｉｐｇｒａｍ模型得到每个节点的向量。设Ｇ＝

（Ｖ，Ｅ）为给定网络。设ｆ：Ｖ→Ｒｄ

是从节点到特征表示的映射函数，ｄ是指定特征表示的维数，ｆ是大小为｜Ｖ｜×ｄ的参数矩阵。

对于每个源节点ｕ∈Ｖ，Ｎｓ

（ｕ）Ｖ定义为通过邻域采样策略ｓ生成的节点ｕ的网络邻域。将网络中的特征学习表示为最大似然优化问题，ｎｏｄｅ２ｖｅｃ优化的目标是给定每个顶点条件下，令其近邻顶点出现的概率最大。总体的目标函数如式（６）所示。

ｍａｘｆ∑ｕ∈Ｖ

ｌｏｇＰｒ（Ｎｓ

（ｕ）｜ｆ（ｕ））（６）

其中：ｆ（ｕ）代表当前节点；Ｎｓ

（ｕ）是邻居节点（以ｓ的方法采样得到的），通过引入ｓ

ｋｉｐｇｒａｍ模型中的两个假设方便计算该结果。

ａ）假设条件独立，即采样每个邻居是相互独立的，将采样每个邻居的概率相乘就可以计算采样所有邻居的概率，如式（

７）所示。Ｐｒ（Ｎｓ

（ｕ）｜ｆ（ｕ））＝∏ｎｉ∈Ｎｓ

（ｕ）Ｐｒ（ｎｉ

｜ｆ（ｕ））（７）

ｂ）假设特征空间中的对称性。源节点和邻域节点在特征空间中具有彼此对称的效果。因此，将每个源—邻域节点对的

条件似然建模为ｓｏｆｔｍａｘ单元，该ｓｏｆｔｍａｘ单元由其特征的点积参数化，如式（

８）所示。Ｐｒ（Ｎｓ

（ｕ）｜ｆ（ｕ））＝ｅｘｐ（ｆ（ｎｉ）·ｆ（ｕ））∑ｖ∈Ｖｅ

ｘｐ（ｆ（ｖ）·ｆ（ｕ））（８）

根据上述假设，公式中的目标函数可以简化为

ｍａｘｆ∑ｕ∈Ｖ

［－ｌｏｇＺｕ＋∑

ｎｉ∈Ｎｓ

（ｕ）ｆ（ｎｉ

）·ｆ（ｕ）］（９）

其中：Ｚｕ＝∑ｖ∈Ｖ

ｅｘｐ（ｆ（ｖ）·ｆ（ｕ）），即在给定ｕ和对应的邻近点Ｎ（ｕ）下，通过求这个目标函数最大值的情况下得到ｆ（ｎ）的函

数形式，从而得到每个节点的向量。由于归一化因子Ｚｕ＝

∑ｖ∈Ｖ

ｅ

ｘｐ（ｆ（ｖ）·ｆ（ｕ））的计算代价高，本文采用负采样（ｎｅｇａｔｉｖｅｓａｍｐｌｉｎｇ）技术优化。

３）重新计算ｍｉＲＮＡ之间的相似性通过网络表示学习ｎｏｄｅ２ｖｅｃ算法将网络中的每个节点表示成低维向量，既利用了原始的相似度矩阵，又保留了网络内部拓扑结构特征。同时，为了更好地衡量ｍｉＲＮＡ节点之间的相似性，本文基于ｍｉＲＮＡ节点的表示向量来计算任意两个ｍｉＲＮＡ之间的相似度，得到新的ｍｉＲＮＡ相似度矩阵ＮＭＳ。本文从方向和距离来度量两个ｍｉＲＮＡ节点表示向量之间的差异。一般采用余弦相似度来度量两个向量在空间中的相似度

大小，余弦值越接近１

，表明两个向量之间的夹角越接近０度，两者越相似。ｍｉＲＮＡ节点的余弦相似度矩阵用ＣＭＳ来表示，计算方法为

ＣＭＳ＝

∑ｎ

ｉ＝１ｍｉ·ｎｉ

∑ｎ

ｉ＝１

ｍ２

槡ｉ

·∑ｎｉ＝１

ｎ２

槡

ｉ

（１０）

其中：ｎ为节点向量的维度；ｍｉ和ｎｉ为ｍ

ｉＲＮＡ节点ｍ、ｎ的表示向量第ｉ维的数值。基于欧氏距离来计算两个ｍｉＲＮＡ节点向量之间的距离，定义ＭＭＳ为ｍｉＲＮＡ节点向量基于欧氏距

离获得的相似度矩阵，如式（

１１）所示。ＭＭＳ（ｍ，ｎ）＝

∑ｎ

ｉ＝１

（ｍｉ－ｎｉ

）槡

２

（１１）

由于通过欧氏距离计算得到的值是一个非负数。通常来

说，两个向量越相似，它们之间的距离就越小，越接近于０

。在传统的ｍｉＲＮＡ相似度计算过程中，两个相同ｍｉＲＮＡ的相似度

值为１，表明相似程度最高，而相似度矩阵中为０的值表明这两个ｍｉＲＮＡ之间不存在相似性。为了将ＭＭＳ矩阵的取值范围映射到０～１，同时确保更相似的两个ｍｉＲＮＡ节点之间其相

似度值越接近于１

，本文根据式（１２）对ｍｉＲＮＡ相似度矩阵ＭＭＳ进行归一化处理。

ＭＭＳｎｏｒｍａｌ

（ｍ，ｎ）＝１－ＭＭＳ（ｍ，ｎ）－Ｍｉｎ（：，ｍ）

Ｍａｘ（：，ｍ）－Ｍｉｎ（：，ｍ）

（１２）

其中：Ｍｉｎ（：，ｍ）代表矩阵ＭＭＳ中第ｍ行的最小值；Ｍａｘ（：，

ｍ）为矩阵ＭＭＳ中第ｍ行的最大值。通过融合这两个矩阵得

到新的ｍ

ｉＲＮＡ矩阵ＮＭＳ，如式（１３）所示。ＮＭＳ＝０．５×（ＣＭＳ＋ＭＭＳ）

（１３）

４）为了计算潜在的ｍｉＲＮＡ疾病关联的分数，本文基于关

联规则推断的方法，即基于ｍ

ｉＲＮＡ相似性的推断方法（ＭＢＳＩ［１２］

）来预测未知的ｍｉＲＮＡ疾病关联。

ＭＢＳＩ在预测疾病ｄｉ与ｍｉＲＮＡｍｊ关系Ｓ（ｄｉ，ｍｊ

）时，如果ｍｉＲＮＡｍｊ与另一个ｍｉＲＮＡ相似，而该ｍｉＲＮＡ与疾病ｄｉ之间存在已知的关联关系，则疾病ｄｉ与ｍｉＲＮＡｍｊ的相关性可以用置信度得分计算，如式（１４）所示。

ｃｏｎｆｉｄｅｎｃｅ（ｄｉ，ｍｊ）＝∑ｍｌ＝１，ｌ≠ｊ

ＮＭＳ（ｍｊ，ｍｌ）·ａｉ，ｌ∑ｍ

ｌ＝１，ｌ≠ｊ

ＮＭＳ（ｍｊ，ｍｌ）（１４）

·７６３１·第５期耿　霞，等：一种基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法　

其中：ＮＭＳ（ｍｊ，ｍｌ）是ｍｉＲＮＡｍｊ和ｍｌ之间的相似性；

如果疾病ｄｉ和ｍｉＲＮＡｍｌ存在已知关联，则ａｉ，ｌ

的值为１，否则为０。为了将潜在ｍｉＲＮＡ疾病关联对分数的取值映射到０～１，本文把置信度得分进行归一化处理，如式（１５）所示。

ｃｏｎｆｉｄｅｎｃｅｎｏｒｍａｌ（ｄｉ，ｍｊ

）＝ｃｏｎｆｉｄｅｎｃｅ（ｄｉ，ｍｊ）－Ｍｉｎ（：ｍｊ

）Ｍａｘ（：ｍｊ）－Ｍｉｎ（：ｍｊ

）（１５）其中：Ｍｉｎ（：，ｍｊ）是ｍｉＲＮＡｍｊ与已知关联疾病的最小置信度；

Ｍａｘ（：，ｍｊ）是ｍｉＲＮＡｍｊ与已知关联疾病的最大置信度。通过ＭＢＳＩ可以计算出潜在疾病ｍｉＲＮＡ关联的置信度得分，给定一种疾病ｄ，对与疾病ｄ存在潜在关联的ｍｉＲＮＡ按照置信度

得

分降序排列，排名越靠前则表明该ｍ

ｉＲＮＡ越有可能是疾病ｄ的候选ｍｉＲＮＡ。２２　算法描述

综上所述，本节通过引入ｌｎｃＲＮＡ数据构建ｍｉＲＮＡｌｎｃＲＮＡ疾病异构网络，采用ｎｏｄｅ２ｖｅｃ算法提取出网络的拓扑

结构特征，将网络中的节点表示成低维向量，重新计算ｍ

ｉＲＮＡ相似度矩阵，最后基于ｍｉＲＮＡ相似性的关联规则推断方法预测潜在的ｍｉＲＮＡ疾病关联，提出基于网络表示学习的ｍｉＲＮＡ疾病关联预测算法ＮＲＬＭＤＡ。具体描述如算法１所示。

算法１

　ｍｉＲＮＡ疾病关联预测算法ＮＲＬＭＤＡ输入：ｍｉＲＮＡ疾病关联数据ＭＤ，ｌｎｃＲＮＡ疾病关联数据ＬＤ，ｌｎｃＲＮＡｍｉＲＮＡ相互作用数据ＬＭ，随机游走参数ｐ、ｑ，节点的邻域大小ｗ，从每个节点出发产生的序列数目ｎｕｍ，随机游走产生的序列长度ｌ，每个节点拓扑信息的向量维度ｄｉｍ，疾病ｄ。

输出：疾病ｄ关联的ｍｉＲＮＡ候选排列。

初始化疾病相似性矩阵ＳＤ（ｄｉ，ｄｊ），ｍｉＲＮＡ相似性矩阵ＳＭ（ｍｉ

，ｍｊ），ｌｎｃＲＮＡ相似性矩阵ＬＭ（ｌｉ，ｌｊ

）ｆｏｒｉ＝１ｔｏｎｄｏｆｏｒｊ＝１ｔｏｎｄｏ

　通过式（１）～（３）计算疾病相似性ＳＤ（ｄｉ，ｄｊ

）　通过式（４）（５）计算ｍｉＲＮＡ相似性ＳＭ（ｍｉ，ｍｊ

）和ｌｎｃＲＮＡ相似性ＬＭ（ｌｉ，ｌｊ

）；ｅｎｄｆｏｒｅｎｄｆｏｒ

根据已知的ＭＤ、ＬＤ、ＬＭ结合ＳＤ、ＳＭ和ＬＭ构造ｍｉＲＮＡｌｎｃＲＮＡ疾病图Ｇ；

根据式（６）～（９）得到疾病表示向量矩阵ＤＭ和ｍｉＲＮＡ表示向量矩阵ＭＭ；

根据式（１０）～（１３）重新计算ｍｉＲＮＡ相似度，得到新的ｍｉＲＮＡ相似度矩阵Ｎ

ＭＳ；根据式（１４）（１５）计算疾病ｄ关联各ｍｉＲＮＡ的预测得分；对疾病ｄ关联关系未知的ｍｉＲＮＡ根据置信度得分降序排列；

３　实验结果与分析

本章介绍模型评估方法及评价标准，对各个模型的实验结

果进行分析与比较，最后分析了三个具体疾病的案例。３１　模型评估方法及评价标准

为了对ＮＲＬＭＤＡ模型的性能进行评估，采用留一交叉验证方法和五折交叉验证方法。本文以接收者操作特征曲线（ｒｅｃｅｉｖｅｒｏｐｅｒａｔｏｒｃｈａｒａｃｔｅｒｉｓｔｉｃｃｕｒｖｅ，ＲＯＣ曲线）来比较模型的性能。以本文对ｍｉＲＮＡ疾病预测为例，对于每一个阈值ｋ（０≤ｋ≤１

００），真阳性率表示预测结果中排名前ｋ％的关联对中已知关联的数目占所有用来测试的已知关联数目的比例，假阳性

表示的是预测结果中排名在前ｋ

％的未知关联数目占所有用来测试的未知关联数目的比例。为了更加直观地对模型进行

比较，使用Ｒ

ＯＣ曲线下的面积（ａｒｅａｕｎｄｅｒｒｏｃｃｕｒｖｅ，ＡＵＣ）作为衡量预测性能的标准。

３２　实验分析与模型比较

ｎｏｄｅ２ｖｅｃ通过引入两个超参数ｐ和ｑ来控制随机游走的

策略。参数ｐ控制重复访问刚刚访问过的顶点概率；参数ｑ控制着游走是向外还是向内，若ｑ＞１，倾向于访问和ｔ接近的顶点（偏向ＢＦＳ）。若ｑ＜１，倾向于访问远离ｔ的顶点（偏向ＤＦＳ），如表２所示，经过测试，最终本文选取的参数为ｐ＝０２５，ｑ＝１，ＮＲＬＭＤＡ模型性能最好。实验中节点的邻域大小ｗ为５，从每个节点出发产生的序列数目ｎ为５０，随机游走产生的序列长度ｌ为１００，每个节点拓扑信息的向量维度ｄｉｍ为１２８。

表２　不同参数ｐ和ｑ下ＮＲＬＭＤＡ模型的性能Ｔａｂ．２　ＰｅｒｆｏｒｍａｎｃｅｏｆＮＲＬＭＤＡｍｏｄｅｌｗｉｔｈｄｉｆｆｅｒｅｎｔｐａｒａｍｅｔｅｒｓｐａｎｄｑ

ｐｑ

０．２５０．５１２４０．２５０．８３８１０．８４２３０．８４６８０．８２６９０．７９０４０．５０．８１３１０．８１５７０．８１７６０．８１８８０．８１６４１０．７９２６０．８３０５０．８３９２０．８１８００．８０６４２０．８０６３０．８０９５０．８１６００．７９７９０

．７９７２４

０．８３５４

０．８３３３

０．８１４７

０．８１０９

０．７９５５

采用留一交叉验证方法，每次保留一个已知的ｍｉＲＮＡ疾

病关联样本用于测试，假设其为未知样本，然后利用Ｎ

ＲＬＭＤＡ进行预测。得到预测结果后，将所有测试样本的得分逐一与未知样本的得分进行比较，按得分由高到低排序。在验证

ＮＲＬＭＤＡ方法的预测效果时，本文选取ＲＷＲＭＤＡ［１３］

、

ＲＬＳＭＤＡ［１４］、ＨＧＩＭＤＡ［１５］、ＤＲＭＤＡ［１６］这四种方法进行比较。

其中ＲＷＲＭＤＡ和ＨＧＩＭＤＡ是基于生物网络的方法，ＲＬＳＭＤＡ和ＤＲＭＤＡ是基于机器学习的方法。通过绘制ＲＯＣ曲线，比较ＮＲＬＭＤＡ与其他四种方法的ＡＵＣ值。

实施留一交叉验证后实验结果如图３所示。ＮＲＬＭＤＡ的ＡＵＣ值为０．８４６８，ＲＬＳＭＤＡ、ＲＷＲＭＤＡ、ＨＧＩＭＤＡ和ＤＲＭＤＡ的ＡＵＣ值分别为０．６９５３、０．７８９１、０．８０７７和０．８３３９。本文

方法要优于其他主流且经典的ｍ

ｉＲＮＡ疾病关联预测模型。值得说明的是，

ＤＲＭＤＡ基于自动编码器从ｍｉＲＮＡ相似性矩阵和疾病相似性矩阵中提取出ｍｉＲＮＡ疾病关联对的特征向量，分类器的性能取决于特征的质量，并且需要负样本。本文采用基于网络学习的表示方法，能够保留网络的拓扑结构信息，并且不需要负样本，因而效果更好，说明ＮＲＬＭＤＡ的有效性。

同时，本文还对ＮＲＬＭＤＡ进行了五折交叉验证。将已知的ｍｉＲＮＡ疾病关联样本平均分为５份，每次取其中一份用于测试。本文选取了１０种具有较多已知ｍｉＲＮＡ关联信息的疾

病进行分析，选取四种经典算法进行比对，分别是ＭＩＤＰ［１７］

、

ＷＢＳＭＤＡ［１８］、ＲＬＳＭＤＡ［１４］和ＨＤＭＰ［１９］。表３给出了各个算法

的比较结果。

表３　不同算法在１０种疾病下的ＡＵＣ值比较

Ｔａｂ．３　ＣｏｍｐａｒｉｓｏｎｏｆＡＵＣｖａｌｕｅｓｏｆｄｉｆｆｅｒｅｎｔａｌｇｏｒｉｔｈｍｓｕｎｄｅｒ１０ｄｉｓｅａｓｅｓ

疾病类型ＭＩＤＰＷＢＳＭＤＡＲＬＳＭＤＡＨＤＭＰＮＲＬＭＤＡ乳腺肿瘤０．８０６０．７５４０．８０２０．７９６０．９６７结肠肿瘤０．７９９０．７０５０．７９７０．８１２０．９４４心力衰竭０．７８１０．７１７０．７６３０．７８６０．９７２肝细胞癌０．７４９０．７１３０．７４２０．７５５０．９５１肺肿瘤０．８９２０．８０００．８７００．９０６０．９２３卵巢肿瘤０．８９３０．８１７０．８８４０．８９１０．９２７胰腺肿瘤０．８８２０．８０７０．８５９０．８９１０．９３４黑素瘤０．８１２０．７５９０．８０１０．８２３０．９５０肾细胞癌０．８０４０．７６６０．７８４０．８１００．９３７胃肿瘤０．７７９０．７４３０．７７３０．７８００．９５１平均ＡＵＣ值

０．８２０

０．７５８

０．８０８

０．８２５

０．９４６

·８６３１·计算机应用研究　

第３８卷

表３的实验结果表明ＮＲＬＭＤＡ算法在心力衰竭这一疾病上的ＡＵＣ最高，达到了０．９７２；同时相比于其他算法，在上述１０种疾病中取得了最高的ＡＵＣ值。ＭＩＤＰ、ＷＭＳＭＤＡ、ＲＬＳＭＤＡ和ＨＤＭＰ算法的平均ＡＵＣ值分别为０．８２０、０．７５８、０８０８、０．８２５，ＮＲＬＭＤＡ的平均ＡＵＣ值为０．９４６，性能比其他四种算法分别高出１２．６％、１８．８％、１３．８％、１２．１％。

采用五折交叉验证的方式，验证加入ｌｎｃＲＮＡ节点后形成的三层网络与原始的ｍｉＲＮＡ疾病双层网络的结果比较，结果如图４

所示。

结果表明，ｍｉＲＮＡｌｎｃＲＮＡ疾病网络在五折交叉验证下的ＡＵＣ值为０．９０４５，而ｍｉＲＮＡ疾病网络的ＡＵＣ值为０．８５８７，加入ｌｎｃＲＮＡ节点后的三层网络效果优于原始的双层网络，ＡＵＣ指标提升了４．５８％。同时，为了进一步比较两种网络结构的预测效果，本文选取了乳腺肿瘤和肝细胞癌这两种具有较多已知ｍｉＲＮＡ关联的疾病，采取五折交叉验证的方式进行比较。实验结果如图５、６

所示。

乳腺肿瘤在ｍｉＲＮＡｌｎｃＲＮＡ疾病网络和ｍｉＲＮＡ疾病网络的ＡＵＣ值分别为０．９６７和０．９１８，肝细胞癌在两种网络的ＡＵＣ值分别为０．９５１和０．８８２，三层网络的预测结果要优于双层网络。对于选定的疾病，加入ｌｎｃＲＮＡ节点后的改进网络的性能高于传统的ｍｉＲＮＡ疾病双层网络，验证了ｍｉＲＮＡｌｎｃＲＮＡ疾病三层网络的有效性。

３３　案例分析

为了进一步验证ＮＲＬＭＤＡ模型对未知ｍｉＲＮＡ疾病关联关系的预测效果，对ＮＲＬＭＤＡ进行了案例分析，分别对乳腺肿瘤、结肠肿瘤和淋巴瘤这三种常见疾病进行验证。实验过程中所有已知的关联关系数据来源于ＨＭＤＤｖ２．０，将这些数据用于训练，然后用训练好的模型对预测结果进行验证，用于验证的数据库包含ｄｂＤＥＭＣ和ｍｉＲ２Ｄｉｓｅａｓｅ。对那些原有数据集中没有相关关系的ｍｉＲＮＡ进行排序，对前２０位的ｍｉＲＮＡ进行验证。

乳腺肿瘤是世界上最常见的肿瘤。２０１６年，美国有超过３５０万名女性患有乳腺肿瘤。Ｓｈｉｂａｈａｒａ和Ｔｉｌｇｈｍａｎ等人发现与正常乳腺细胞相比，ｍｉＲＮＡ在乳腺肿瘤细胞中具有异常表达。例如，ｍｉｒ１２５ｂ、ｍｉｒ１４５和ｍｉｒ１５５在乳腺肿瘤细胞中明显失调。

在乳腺肿瘤评估过程中，选取了与乳腺肿瘤有潜在关联的前２０个候选ｍｉＲＮＡ。表４的结果显示，除了ｈｓａｍｉｒ６４２ａ、ｈｓａｍｉｒ５５２、ｈｓａｍｉｒ１２２４和ｈｓａｍｉｒ５６９与乳腺肿瘤的关联关系未得到证实，其他１６个ｍｉＲＮＡ都可以在ｄｂＤＥＭＣ和ｍｉＲ２Ｄｉｓｅａｓｅ数据库中到对应的关联。除此之外，前１０个候选ｍｉＲＮＡ都被准确地预测出来。

表４　ＮＲＬＭＤＡ对乳腺肿瘤预测的前２０名结果

Ｔａｂ．４　Ｔｏｐ２０ｐｒｅｄｉｃｔｉｏｎｒｅｓｕｌｔｓｆｏｒｂｒｅａｓｔｔｕｍｏｒ

结肠肿瘤是三种常见的癌症之一，占所有癌症病例的１０％。表５显示了ＮＲＬＭＤＡ预测的与结肠肿瘤有关的前２０个ｍｉＲＮＡ候选。其中，除了ｈｓａｍｉｒ９２ａ、ｈｓａｍｉｒ２００ａ和ｈｓａｍｉｒ１９９ａ与结肠肿瘤的关联关系未得到证实，其他１７个ｍｉＲＮＡ都可以在ｄｂＤＥＭ

Ｃ和ｍｉＲ２Ｄｉｓｅａｓｅ数据库中到对应的关联。

表５　ＮＲＬＭＤＡ对结肠肿瘤预测的前２０名结果

Ｔａｂ．５　Ｔｏｐ２０ｐｒｅｄｉｃｔｉｏｎｒｅｓｕｌｔｓｆｏｒｃｏｌｏｎｔｕｍｏｒ

淋巴瘤是起源于淋巴造血系统的恶性肿瘤。在我国，淋巴瘤的发病率位于第１０位，占癌症死亡率的第８位。表６显示了前２０个候选ｍｉＲＮＡ中的１６个与淋巴瘤有关。

表６　对淋巴瘤预测的前２０名结果

Ｔａｂ．６　Ｔｏｐ２０ｐｒｅｄｉｃｔｉｏｎｒｅｓｕｌｔｓｆｏｒｌｙｍｐｈｏｍａ

４　结束语

本文提出了基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法ＮＲＬＭＤＡ。通过引入长链非编码ＲＮＡ疾病关联、长链非编码ＲＮＡ与ｍｉＲＮＡ相互作用和长链非编码ＲＮＡ相似性来构建

９

６

３

１

第５期耿　霞，等：一种基于网络表示学习的ｍｉＲＮＡ疾病关联预测方法　

688IT编程网

一种基于网络表示学习的miRNA-疾病关联预测方法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

一种基于网络表示学习的miRNA-疾病关联预测方法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式