2023年3月第38卷第2期西安石油大学学报(自然科学版)
JournalofXi’anShiyouUniversity(NaturalScienceEdition)Mar.2023
Vol.38No.2
收稿日期:2021 05 04
基金项目:国家重大科技专项项目资助(2017ZX05009-003)
第一作者:彭龙(1996 ),男,博士研究生,研究方向:海上采油工程、智能油气田等。E mail:18611745494@163.com通讯作者:韩国庆(1969 ),男,教授,研究方向:油气田开发。E mail:CUP_706ac@163.com
DOI:10.3969/j.issn.1673 064X.2023.02.015中图分类号:TE98;TP181文章编号:1673 064X(2023)02 0113 09
文献标识码:A
基于机器学习算法的CO2腐蚀速率预测
彭龙,韩国庆,邬书豪,马赫,马少云
(中国石油大学(北京)石油工程教育部重点实验室,北京102249)
摘要:针对传统CO2腐蚀速率预测模型结构简单,
泛化性弱,油田应用效果不佳的问题,本文基于机器学习的思想,采用数据挖掘的手段,研究Na+、Cl-
、pH值、温度、材质等参数对井筒腐蚀的影响,利用相关系数矩
阵确定各因素之间的独立性及对井筒腐蚀速率的影响程度,分别建立了线性回归、支持向量机(SVM)、极端梯度提升(XGboost)算法的CO2腐蚀速率预测模型。以决定系数、平均绝对误差和均方根误差为评价指标,对比分析了不同腐蚀速率预测模型。结果表明,XGboost腐蚀速率预测模型效果最好,线性回归腐蚀速率模型预测效果优于SVM的4种核函数腐蚀速率预测模型。研究结果揭示了基于机器学习的腐蚀速率预测模型有很好的稳定性和泛化能力,预测效果较好,为油田量化CO2腐蚀速率提供了新的方法,在现场中具有一定的推广应用价值。
关键词:CO2腐蚀;
腐蚀速率预测模型;机器学习;线性回归;支持向量机;XGboostPredictionofCO2C
orrosionRateBasedonMachineLearningAlgorithmsPENGLong,HANGuoqing,WUShuhao,MAHe,MAShaoyun
(KeyLaboratoryofMinistryofEducationforPetroleumEngineering,ChinaUniversityofPetroleum(Beijing),Beijing102249,China)
Abstract:ThetraditionalCO2c
orrosionratepredictionmodelhasasimplestructure,weakversatility,andpoorapplicationeffectinoilfields.Basedonmachinelearning,theinfluencesofNa+,Cl-,pH,temperatureandmaterialonwellborecorrosionratearestudiedusing
dataminingmethod,andtheindependenceofeachfact
oranditsinfluenceonwellborecorrosionratearedeterminedusingcorrelationcoefficientmatrix.TheCO2corrosionratepredictionmodelsareestablishedusinglinearregression,supportvectormachineandXGbostalgorithmrespectively.Takingthedeterminationcoefficient,meanabsoluteerrorandrootmeansquareerrorasevaluationindexes,thepredictioneffectsofdifferentcorrosionratepredictionmodelswerecomparativelyanalyzed.TheresultsshowthattheXGboostcorrosionratepredictionmodelisthebest,andthepredictioneffectofthelinearregressioncorrosionratepredictionmodelisbetterthanthatoftheSVMcorrosionratepredictionmodelswithfourkindsofkernelfunctions.Theresearchresultsrevealthatthecorrosionratepredic tionmodelsbasedonmachinelearninghavegoodstabilityandgeneralizationability,andtheirpredictioneffectisgood,w
hichprovidesanewmethodforquantifyingCO2corrosionrateinoilfields,andhascertainpopularizationandapplicationvalueinthefield.Keywords:CO2corrosion;corrosionratepredictionmodel;machinelearning;linearregression;supportvectormachine;XGboost彭龙,韩国庆,邬书豪,等.基于机器学习算法的CO2腐蚀速率预测[J].西安石油大学学报(自然科学版),2023,38(2):113 121.
PENGLong,HANGuoqing,WUShuhao,etal.PredictionofCO2corrosionratebasedonmachinelearningalgorithms[J].JournalofXi’anShiyouUniversity(NaturalScienceEdition),2023,38(2):113 121.
Copyright ©博看网. All Rights Reserved.
西安石油大学学报(自然科学版)
引 言
CO
驱油是近年来国内油田常用的提高采收率的技术之一,据《中国开发的二次采油潜力研究及
提高采收率的发展战略评价研究》的结果表明,CO
2驱适用于现有的1370×108t稀薄油田,能增加可采储量约1.6×108t,在我国石油勘探开采中具有
很大的应用潜力[1]。然而,将CO
引入原油生产系
统时,CO
溶于水会形成碳酸,相同pH值条件下,碳酸对井筒的腐蚀性比盐酸更强,更易造成井筒破
坏事故,导致重大经济损失。随着井筒CO
腐蚀问
题的日益严重,关于井筒CO
腐蚀预测已成为研究的热点问题。根据井筒各处的腐蚀情况采取防腐措施和补救措施,确定最佳更换时间,实现油气井安全
高效的生产,在CO
驱生产过程中具有重要意义。
当前国际上CO
腐蚀速率预测模型主要分为3类,分别为经验型预测模型、半经验型预测模型和机理型预测模型[2]。经验型预测模型主要契合于室内实验数据和现场腐蚀数据,而对腐蚀过程中机理研究较少。典型的经验型预测模型有NorsokM-506模型[3](NO模型),NO模型由低温实验数据与
高温现场数据得出,考虑了温度、pH值、CO
逸度、管壁剪切力等因素,其预测局部腐蚀和多相流动下腐蚀问题误差较大。CorrOcean公司改进Norsok模型提出Corpos模型[4 6](CP模型),CP模型考虑了管内溶液的影响,可以计算沿管线各处的腐蚀速率。JEPSON[7]提出Ohio模型,Ohio模型基于介质传输中的化学反应、电化学反应等,对pH值比较敏感,
Ohio模型在pH值大于5时,CO
腐蚀速率预测精确度偏低。
半经验型预测模型是依据腐蚀过程中化学、电化学及介质传输过程,利用实验室和现场数据确定各因素
的影响因子,从而得出相应的模型。DeWAARD等[8]最早于1975年提出DWM模型(DW75模型),在之后的研究中,DeWaard考虑更
多影响CO
腐蚀速率的因素,分别提出了DW91模型[9]、DW93模型[10]和DW95模型[11]。目前为止,DW95模型是应用最为广泛的半经验预测模型之一,其在低温下很好地契合于大部分的实验结果,具有较高的精度。在DW95模型的基础上,BP公司提出BP模型[12],Interech公司提出ECE模型[13],In ternational公司提出Predict模型[14],这些模型在其特定的腐蚀环境下,都具有不错的效果。
机理型预测模型是以腐蚀电流和电位为基础,
结合材料表面化学、电化学反应和离子扩散作用等因素建立的预测模型。Nesic模型[15 17]是最经典的机理模型,该模型考虑金属表面发生的化学和电化学反应,腐蚀产物膜的影响,FeCO
的沉积生长模型等。机理模型还有1998年的Tulsa模型[18]和2002年的改进版Tulsa模型[18],Shadly等1998年提出的
Tulsa模型能预测有FeCO
垢和流动状态下的CO
2腐蚀,Mclaury等2002年提出的新Tulsa模型对单相模型进行改进,考虑了流体性质和流速对模型的影响。
传统经验模型和半经验模型从本质上说属于多元回归模型的简单应用,是基于某一特定油气田的现场数据或者实验数据建立起来的。机理模型的建立则是基于不同机理和考虑的因素,与现场数据结
合少,预测效果往往不佳。因此以往得出的CO
腐蚀预测模型只能适用于特定的环境,将其推广到其他油气田时稳定性较弱,准确度偏低。随着各种测
量技术、实时采集系统的快速发展,实验数据或者现场数据呈现出高维度、类型多、数量大等特点,传统的腐蚀速率计算模型已不适用。本文基于机器学习的方法从采集的腐蚀数据中进行数据挖掘,建立泛化性更强、准确度更高的腐蚀速率预测模型,揭示了
机器学习算法在预测CO
腐蚀速率上的泛化性、稳定性和精确性,为其在油田的应用提供一定的科学依据。
1 机器学习算法在CO
腐蚀速率预测中的应用
机器学习算法可以分为无监督学习和监督学习。其中无监督学习需要从样本中学习并获得规律;监督学习是在训练样本过程中,要对应确定的结果,然后对未知样本进行结果预测。监督学习可分为分类问题和回归问题,分类问题的标注结果为离散值,回归问题的标注结果为连续值[19 21]。本文所研究的腐蚀速率预测就是典型的监督回归问题。常用的有监督回归算法主要包括线性回归、支持向量机、梯度提升算法等。
本文运用常见的机器学习算法对现场腐蚀数据进行深度挖掘,将提取到数据库中的历史数据进行乱序随机采样,其中抽提的70%数据构建训练集进行训练,建立稳健的腐蚀速率预测模型,剩余的30%数据建立测试集进行样本测试,评估各个机器学习算法的适用性。
Copyright©博看网. All Rights Reserved.
彭龙等:基于机器学习算法的CO2腐蚀速率预测
1.1 线性回归算法
线性回归算法主要学习数据特征与标的结果之间的线性关系,可以假设腐蚀速率与各特征时间是线性关
系,线性回归模型表达式为:
^y=a×x+b。(1)式中:^y为预测的CO2腐蚀速率值;x为样本数据各特征值;y为CO2实际腐蚀速率;a为特征向量对应权重;b为常数。
目标函数确定后,线性回归的损失函数由均方误差确定,其公式如下:
L(a,b)=1n
∑n
i=1(a×xi+b-yi)。(2)式中:n为训练集样本个数,采用梯度下降法[19]
求解目标函数最小化L时的a和b,其主要过程就是不断对参数a和b求偏导,通过多次迭代,使损失函数最小化,过程如下:
w←w-α×
L a,(3)
b←b-α×
b。
(4)将a和b代入式(1),可以得出基于线性回归的腐蚀速率预测模型。1.2 支持向量机回归模型支持向量机(SVM)[20]
最早由苏联学者VladimirN.Vapnik和AlexanderY.Lerner提出,经
过后续学者不断完善,支持向量机回归模型[21]
在解决有监督回归问题上得到很好地运用。SVM回归模型本身是寻求最优的超平面,使得离超平面最近的样本点到超平面的距离最大。该模型能很好地解决非线性问题,给定样本D,其回归模型如下:
D={(x1,y1),(x2,y2),…,(xm,ym)},(5)yi=w×φ(xi)+c。(6)式中:w为超平面的法向量,c为超平面的截距。SVM回归模型要尽量描述训练集D中的每个样本点,考虑到模型拟合值与真实值之间的误差ε,定义支持向量机的损失函数为
f(i)=yi-w×φ(xi
)+c,(7)err(xi,yi
)=0    f(i)≤ε
f(i)-εf(i)>{
ε
(8)
对每个样本引入松弛变量[22]
δi︿
和δ︿
,此时SVM回归模型的损失函数为
minw,c,δi︿
δ︿i
w2+C∑mi=1
(δi︿
+δ︿i),(9)-ε-δi︿
≤yi-w×φ(xi)-c≤ε+δ︿
,(10)δi︿
≥0,δ︿
i≥0
(11)用拉格朗日(Lagrange)函数将目标函数变成无约束的形式:
f(x)=min
w,c,δi︿
,δ︿
w2+C∑mi=1(δi︿
+δ︿i
)。(12)
最优超平面求解问题通常比较复杂,为解决此问题,引入L
agrange乘子:β︿
i=(β︿
1,β︿
2,…,β︿
m),(13)βi︿=(β1︿
,β2︿,…,βm︿
),(14)u︿
i=(u︿
1,u︿
2,…,u︿m),(15)ui︿=(u1︿
u2︿,…,um︿
。(16)
引入Lagrange乘子后,求解过程转化为对偶问
题,得到Lagrange函数为
L=(w,c,δi︿
,δ︿
i,β︿
i,βi︿
,u︿
i,ui
︿
)=1
w2+C∑m
i=1(δi︿
+δ︿
正则化回归算法i)-∑m
i=1δi︿
×ui︿
-∑m
i=1δ︿
i×u︿
i+∑m
i=1βi︿
×(yi-w×φ(xi)+c)∑m
i=1β︿
i×(yi-w×φ(xi
)+c)。(17)
令L(w,c,δi︿
,δ︿
i,β︿
i,βi︿
,u︿
ui︿
对w,c,δi︿
,δ︿
分别求偏导为0。该过程满足Karush Kuhn Tucker(KKT)条件,KKT条件如下:
β
i︿
(f(xi)-yi-ε-δi︿
)=0;β︿
i(f(xi)-yi-ε-δ︿i)=0;βi︿
×β︿i=0,δi︿×δ︿
i=0
;(C-βi︿
)×δi︿
=0,(C-β︿i)×δ︿i=0
。(18)经过KKT条件求解后,SVM模型可以表示为:
f(x)=∑m
i=1
(β︿
i-βi︿
)xiTxi+c。(19)
通过SMO算法对f(x)进行求解,(β︿
i-βi
︿
)不为0的样本为支持向量,求解得出β︿
i和β︿
,进而求出系数w和c。
若考虑不同特征映射形式的影响,则引入不同核函数进行区分。常见的核函数类型一般有线性核、多项式核、高斯径向基核等,核函数可表示为:
K(xi,xj)=ΦT(xi)Φ(xj
)。(20)
最优的核函数支持向量回归模型为:
f(x)=∑m
i=1
(β︿
i-βi︿
)ΦT(xi)Φ(xj)+c。(21)—
511—Copyright ©博看网. All Rights Reserved.
西安石油大学学报(自然科学版)
支持向量机回归模型建立后,不同的核函数都可以预测CO2腐蚀速率。1.3 极端梯度提升算法
梯度提升算法(GBoost)属于集成学习算法,通过多个弱的预测模型集合生成新的较强的预测模
型[
23]。极端梯度提升(XGBoost)由陈天奇[24]提出,高效地对梯度学习算法进行改进,取得很好的预测效果。XGBoost目标函数由训练误差和正则化惩罚组成,目标函数如下:
Obj=∑p
i=1l(zi-z︿
i)+∑K
i=
1Ω(fk),(22)z︿
=∑K
i=1fk
(xi)。(23)
式中:l为损失函数,z︿
为第i个样本的预测值,Ω为正则化项,xi为第i个样本,K为树的总个数,fk表示第k颗树的预测结果。
假设新加入的树模型为ft
(x),则加入模型后样本xi的预测结果为
z︿i
=z︿
i(t-1)
+ft(xi
)。(24)
将新加入的树模型代入到目标函数中,得到:
Obj=∑p
i=1l(zi,z︿
it
+∑t
i=
1Ω(fi)=∑p
i=1l
(zi,z︿i
(t-1)
+ft(xi))+Ω(ft
)+O。(25)
式中:
O是一个常量,对目标函数进行泰勒展开,可以得出损失函数l对于z︿
i(t-1)
的一阶偏导数gi和二
阶偏导数hi
。gi= z︿i
(t-1)l(zi,z︿i
(t-1)
);
(26)hi= z︿i
(t-1)l(zi,z︿i(t-1)
)。(27)
将目标函数进行二阶泰勒展开得:
Obj=∑pi=1l(zi,z︿i(t-1))+gift(xi
+12hift2(xi
)+Ω(ft
)+O。(28)
对于每一棵回归树,其模型表示为
ft
(x)=wq(x),w∈RT,q:Rd→{1,2,…,T}。(29)
式中:
w为叶子节点权重,q(x)为样本x对应的叶子节点,T为该树的叶子节点个数。一个树的复杂度可以定义为
Ω(ft)=γT+12
λ∑Tj=1wj2。(30)
式中:γ为超参数,wj2
为树上叶子节点权重的1
2范式平方。树的复杂度用于约束树的结构,避免发生过
拟合。
为方便计算,定义叶子结点j对属于结点j的所有样本的一阶偏导数累加之和为Gj
,为常量;叶子结点j对属于结点j的所有样本的二阶偏导数累加之和为Hj
,为常量。Gj=∑i∈Ij
gi
,(31)Hj=∑i∈Ij
hi
。(32)
代入到目标函数中,进行二阶泰勒展开,得出最终的目标函数为
Obj(t)=∑Tj=1[Gjwj+12(Hj+λ)wj2
]+γT。(33)此时,每个叶子节点和权重wj 及最优目标值
Obj可表示为
wj
=-GjHj
+λ,(34)
Obj=-12∑Tj=1Gj
Hj+λ+γT。(35)XGBoost模型建立后,对采集数据进行训练,就
能预测CO2腐蚀速率。
2 数据采集与分析
2.1 数据采集
本研究所采集的XX油田的实验数据样本共
216条,样本数据包含10组特征,分别为Na+
质量浓度、Mg2+质量浓度、Ca2+质量浓度、Cl-质量浓度、SO42-质量浓度、HCO3-质量浓度、CO32-质量浓度、
pH值、温度及材质,样本标的结果为CO2腐蚀速
率,表1截取部分数据(24条)进行展示,构建出多变量控制下的腐蚀速率预测模型。2.2 特征分析
10组特征各自对腐蚀速率的影响进行单因素分析。采用控制变量法,考虑单一特征对腐蚀速率
的影响时,其他特征维持不变。阳离子以Na+为例,阴离子以Cl-为例。实验结果如图1—图4所示。
从图1可以看出,随着Na+
质量浓度增加,氧气
在溶液中的扩散能力变弱,抑制氧的去极化反应,导致腐蚀速率降低。
由图2可知,
腐蚀速率随着Cl-
质量浓度增大先增大后减小,这是因为当腐蚀产物膜不完整时,
Cl-
能加剧腐蚀。腐蚀产物膜形成后,金属表面附着的Cl-能抑制腐蚀反应的发生,导致腐蚀反应速
率下降。
整体而言,腐蚀速率随着pH值的增加而降低。pH值越小,越能加剧酸性物质与金属的反应速率,而当pH值大于7时,井壁上腐蚀产物膜稳定,对腐蚀起到抑制作用。
611—Copyright ©博看网. All Rights Reserved.
彭龙等:基于机器学习算法的CO2腐蚀速率预测
表1 部分腐蚀数据
Tab.1 Partialcorrosiondata
号ρ(Na+)/(mg·L-1)ρ(Mg2+)/(mg·L-1)ρ(Ca2+)/(mg·L-1)ρ(Cl-)/(mg·L-1)ρ(SO42-)/(mg·L-1)ρ(HCO3-)/(mg·L-1)ρ(CO32-)/(mg·L-1)
pH值温度/℃材质腐蚀速率/
(mm·a-1
)11000
50
50
700
100
1300
100
60J55
0.17612100050507001001300100760N800.18173100050507001001300100760P1100.18934150050507001001300100760J550.17515150050507001001300100760N800.18076150050507001001300100760P1100.18837200050507001001300100760J550.17468200050507001001300100760N800.17879200050507001001300100760P1100.184610250050507001001300100760J550.171611250050507001001300100760N800.1764122500505
07001001300100760P1100.181513350050507001001300100760J550.166214350050507001001300100760N800.171015350050507001001300100760P1100.176616400050507001001300100760J550.163117400050507001001300100760N800.169118400050507001001300100760P1100.172519500050507001001300100760J550.161820500050507001001300100760N800.166721500050507001001300100760P1100.169422600050507001001300100760J550.159823600050507001001300100760N800.161924
600050507001001300100760P110
0.1637
  由图4可得,腐蚀速率随温度的升高而增大。因为温度升高,化学反应速率加快,CO2
腐蚀速率增大。
图1 钠离子浓度对腐蚀速率的影响
Fig.1 Effectofsodiumionconcentrationoncorrosionrat
图3 pH值对腐蚀速率的影响
Fig.3 EffectofpHvalueoncorrosionrat
图2 氯离子浓度对腐蚀速率的影响
Fig.2 Effectofchlorideionconcentrationoncorrosionrat
图4 温度对腐蚀速率的影响
Fig.4 Effectoftemperatureoncorrosionrate
结合图1—图4分析可知,J55的抗腐蚀性能最好,N80其次,P110的抗腐蚀性能最弱。
711—Copyright ©博看网. All Rights Reserved.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。