熊政辉,李小军,戴志军,陈苏. 2019. 基于L 1范数正则化的强震动加速度记录基线漂移识别方法. 地震学报,41(1):111−123. doi :10.11939/jass.20180072.
Xiong Z H ,Li X J ,Dai Z J ,Chen S . 2019. A method for identifying the baseline drift of strong-motion records based on L 1-norm regularization . Acta Seismologica Sinica ,41(1):111−123. doi :10.11939/jass.20180072.
基于L 1范数正则化的强震动加速度记录
基线漂移识别方法*
熊政辉1,2) 李小军1,2), 戴志军1,2) 陈 苏1,2)
1) 中国北京100081中国地震局地球物理研究所
2) 中国北京100081中国地震风险与保险实验室
摘要 本文提出了一种基于L 1范数正则化的基线校正新方法,即以拟合速度时程误差最小为目
标,以基线漂移本身尽可能小为约束条件,经过凸优化多次迭代自动求解出满足条件的基线漂
移,避免了人为选取基线漂移分段次数和基线漂移起止时刻的主观干扰;随后利用该方法对多组
加入了基线漂移噪声模型的强震动加速度记录进行验证。结果表明:本文方法对于识别和处理单
段式、两段式和多段式的基线漂移噪声具有普适性,能敏锐地捕捉到速度时程发生漂移的趋势
(斜率变化),无需预先设定加速度基线漂移模型也可有效地识别出多种基线漂移噪声的起止位
置和漂移程度;地震记录事前部分对本文方法处理结果影响较大,当记录事前部分足够长时(如
20 s ),识别基线漂移噪声的准确性较高,位移时程可以较好地与原始位移匹配;而对于发生漂移
的速度时程,本文方法可以不受地震事前部分长短的干扰,甚至在加速度记录出现明显丢头现象
时,也能很好地实现峰值速度和整个速度时程的恢复。
关键词 强震动 基线校正 L 1范数正则化 加速度记录 位移
doi :10.11939/jass .20180072 中图分类号:P315.63 文献标识码:A
A method for identifying the baseline drift of strong-motion
records based on L 1-norm regularization
Xiong Zhenghui 1,2) Li Xiaojun 1,2), Dai Zhijun 1,2) Chen Su 1,2)
1) Institute of Geophysics ,China Earthquake Administration ,Beijing 100081,China
2) China Earthquake Risk and Insurance Laboratory ,Beijing 100081,China
Abstract :To identify the accurate baseline drift in ground acceleration ,velocity ,and displace-
ment time series is one of the basic and challenge problems in the research of strong ground
motion . This study proposes a new baseline-correction method based on L 1-norm regulariza-
tion . It aims at minimizing the error of fitting velocity trace subject to let the sum of absolute
values of acceleration baseline drift be small . As the baseline-offset is figured out by the convexity-
optimized tool automatically in this L 1-norm regularization based baseline-correction method ,
* 基金项目 国家自然科学基金项目资助(61472373,51508526)、中央级公益性科研院所
基本科研业务专项(DQJB17C05,DQJB17B03)共同资助.
收稿日期 2018−05−31收到初稿,2018−06−25决定采用修改稿.
通信作者 e-mail :beerli@vip.sina
第 41 卷 第 1 期
地 震 学 报Vol . 41,No . 1
2019 年 1 月 (111−123)ACTA SEISMOLOGICA SINICA Jan .,2019
112地 震 学 报41 卷
the subjective interferences can be well avoided such as selecting segmentation times and the
start and end moments. And then representative noise models of acceleration baseline offset are
added respectively to typical strong-motion records in order to test and verify the new method.
The results shows that our method is universal for identifying and processing single-,double-,and multi-stage baseline drift noises. It can sensitively capture the trend (slope) change of the
velocity trace while it’s no need to set segmentation times and positions of piecewise linear fit-
ting in advance. The pre-event interval of strong-motion record has a great influence on the
processing results of this method. If the pre-event interval is long enough (e.g. 20 seconds) in a
record,the identification of the baseline drift noise will be much more accurate,and the
recovered displacement trace will match better with the real one. Additionally,this method
shows good performance to recover peak ground velocity and the whole velocity time series
even if the record almost has no pre-event portion.
Key words:strong ground motion;baseline correction;L1-norm regularization;accelerograph records;displacement
引言
强震动观测是地震工程和工程地震研究中的重要环节。大量有价值的强震动记录,可为震源机制、地震动衰减规律、场地和活断层对地震动的影响、土与结构的相互作用、典型结构的地震反应特性等方面的研究提供可靠的基础资料(彭小波等,2010,2011)。而强震动加速度记录中往往会存在基线漂移(Iwan et al,1985;Boore,2001;周宝峰等,2013),Chiu (1997)指出微小的加速度漂移会导致积分得到的速度和位移产生巨大的数值误差,例如0.01 cm/s2加速度漂移在持时为60 s时,积分得到的速度会有0.6 cm/s的误差,得到的最终位移误差可达到18 cm,而速度时程和位移时程对于地震近断层地面运动规律和极震区抗震设计等的深入研究具有重要作用(于海英等,2009)。
合理判断强震记录中基线漂移的位置及漂移程度并提供合理可行的校正方法,是强震动数据处理的基本问题之一(周宝峰等,2013)。模拟式记录仪的强震动记录,由于缺少事前部分等原因,判断零线复杂
且不准确,研究人员普遍认为模拟式记录仪得到的加速度记录难以用来估算位移(Housner,1947;Hershberger,1955;Trifunac,1970;Trifunac,Lee,1974)。20世纪70年代逐渐发展起来的数字强震仪,具有高精度、宽频带和预存储特性(Boore,2005),有效地克服了模拟式记录仪的缺点。此后,研究人员通过对帕克菲尔德地震、集集地震和汶川地震等一系列重大地震的数字强震动记录的研究(Iwan et al,1985;Boore,2001;Wang et al,2003;Wu,Wu,2007;Chao et al,2010;Wang et al,2011a,2013),认为数字强震仪的加速度记录积分得到的位移包含长周期信息,对于近断层大震所产生的地面永久位移,在一定条件下可以通过高质量的加速度记录积分得到,然而加速度记录中普遍存在的基线漂移对最终位移影响较大。周宝峰等(2013)指出为防止永久位移信息的损失或畸变,客观地获得地震动永久位移,采用基线校正的方法进行强震动记录以避免滤波。但是由于加速度时程中基线漂移的复杂性,很难从加速度记录中直观地、准确地判断基线漂移的起始和结束位置以及漂移的程度。因此,通常选择速度时程为切入点进行分析,从而识别永久位移。彭小波等(2011)将获取近断层同震位移的基线处理方法总体概括为基于分段拟合和基于小波分析两大类,而在选择合适的分段拟合方法时可以将加速度噪音模型分为单段式、多段式和脉冲
1 期熊政辉等:基于L1范数正则化的强震动加速度记录基线漂移识别方法113
式;同时也指出真实的加速度噪声形式可能更为复杂,使用几种模型联合分析或开发新模型来进行评估很有必要,这些方法应注意平衡主观经验和客观判断条件。Wang等(2011a)在总结前人研究的几种基
线校正方法后认为,基于阈值方法确定基线漂移时刻的方法往往会导致对真实基线偏移的评估不准确,因为基线漂移不一定伴随着最强烈的地面震动,而其它校正方法虽然可以通过手动调整参数来校准改善,但参数选择都是由研究人员主观决定的,基于此其提出一种改进的可自动化的经验基线校正方法。
现今通用的基线校正方法中,一般假设加速度在某个给定的时间段内发生基线漂移,且给定了基线漂移的次数。这些参数往往是凭借主观经验给定的。通常根据对原始记录积分得到速度时程的漂移情况进行判断,然后运用分段线性拟合速度的方法,获得加速度时程的基线漂移。但在分段拟合时如何确定分段次数和分段点位置,即加速度在什么时间段内发生偏移,往往需要人为进行选择。这导致了该类基线校正程序的主观性太强,不容易标准化和自动化(周宝峰等,2013)。
当地震发生以后,不同震级和频率特性的地震波传播到不同距离和场地条件的台站,强震仪采集到的加速度记录中发生基线漂移的随机性很强。以基线漂移初始时刻的选取为例,最为常用的有两种方式:一是认为基线漂移主要受强震仪的仪器响应影响,发生在加速度大于50 cm/s2的初始时刻;二是认为基线漂移主要受到地面初始震动影响,发生在地震波P波到达的初始时刻。导致加速度漂移的因素繁多且随机性强,不仅会产生低频误差(包括仪器噪声、背景噪声、初始值等),还会因地面扭转和倾斜导致仪器倾斜,因此很难清楚地确定加速度漂移所发生的具体时刻。无论是选择强震仪记录的加速度幅值达到事先确定的某个阈值的时刻,还是选择强震仪所在位置的地面初始震动时刻,都是基于研究人员对强震动数据已有认识的一种经验判断。对集集地震和汶川地震中大量强震动记录进行基线校正,得出主观干
预选择基线漂移分段起止点的位置,这对基线校正处理后得到的位移结果有很大的影响(Boore ,2001;Wang et al,2003;王国权,周锡元,2004;周宝峰等,2013)。
为此,本文拟运用凸优化中的L1范数正则化方法,求得满足条件的加速度基线漂移最优解,即以分段线性拟合速度时程的方差与求解的基线漂移的绝对值之和最小为目标,不再人为选取基线漂移的起止时刻点,尝试获得一种适用性更为广泛的基线校正方法;并通过对人工加入加速度基线漂移噪声的识别,检验该方法在进行基线校正处理时识别基线漂移的准确性和精度。
1 L1范数正则化
范数是用于衡量某个向量空间(或矩阵)中的每个向量长度或大小的量。L1范数则表示某个向量中所有元素绝对值的和,它可以有效地实现稀疏表示(sparse representations),防止数据过拟合,有利于特征选取,通过不断迭代优化去掉数据中无效信息的特征,把这些特征对应的权重置为零;此外其模型结构也相对简单,更具有“可解释性”。因L1范数具有较好的优化求解特性(可以解决非确定性多项式问题,即NP-hard问题)被广泛应用。
L1范数正则化是双准则式(即保证拟合残差A x-b较小的同时,也使得向量x尽可能小),残差用Euclid范数(||A x-b||2)度量,而正则化用L1范数(||x||1)进行(Boyd,Vandenberghe,2004)。L1范数正则化可以用作求取稀疏解的启发式算法,可以较好地解决下式求解最小值的优化问题:
A ∈R m ×n b ∈R m x ∈R n 式中,为字典矩阵,为拟合的目标,λ(λ>0)为正则化参数,为所求最优解(稀疏解)。
l1正则化的作用λ||x ||1式(1)所求问题是最小绝对值收敛和选择算子(least absolute shrinkage and selection operator ,简写为LASSO )的另一种等价表现形式(Tibshirani ,1996),也可以看作是加了约束条件()的最小二乘拟合方法(A ,b 为数据,x 为所求变量)。这是一种非常典型的凸优化形式,由凸优化理论分析可知,式(1)有且只有一个全局最优解(Boyd ,Vandenberghe ,2004)。求解此类问题的方法很多,大致可以分为3类(周巍,2013):① 迭代最优化算法(如最速下降法、共轭梯度法、迭代重加权最小二乘法、迭代收缩算法和内点法等);② 同伦算法;③ 贪婪算法。其中,内点法是一种非常重要且被广泛使用的最优化方法,例如求解二次规划(其特例为最小二乘优化问题)、几何规划等凸优化问题。凸优化工具包的使用也使得这些优化方法变得简单和便捷。各类求解算法的具体过程有多篇论文进行了详细阐述,例如:Boyd 和Vandenberghe (2004)和Schmidt (2005)对内点法和最速下降法等经典算法的推导;Efron 等(2004),Donoho 和Tsaig (2008)对同伦算法的推导;Mallat 和Zhang (1993)对贪婪算法的推导。周巍(2013)对这几种方法进行了总结,并对式(1)的原对偶内点法和迭代收缩类算法进行了详细的推导和试算比较。在地震数据处理和分析中,范数正则化的凸优化应用也有较多研究成果(Wang et al ,2011b ;Dai et al ,2014;符伟,刘财,2015;李欣等,2018)。
由于基线漂移受多种因素的综合影响,本文认为:① 加速度基线发生漂移是随机的、预先无法确定漂移次数的;② 某一时刻基线发生漂移后会保持不变,在另一时刻发生突变后一段时间内继续保持不变,即加速度漂移是时间的分段线性函数(阶梯函数);③ 地震动结束后速度尽量为零。在以上假设基础上,基于常用的最小二乘分段线性拟合速度时程,以到加速度基线漂移的思路,结合L 1范数的稀疏性特点,本文提出运用L 1范数正则化方法来求解最优化的基线漂移,以在拟合漂移的速度时程时方差最小为目标,并同时使得所求的基线漂移本身也尽可能小。即在式(1)中设b 为待拟合的速度,x 为所需求解的基线漂移。然后运用MATLAB 中CVX 凸优化工具包来求解x 。根据Schmidt (2005)对参数λ取值方法的总结和Tibshirani (1996)给出的示例,本文设置正则化参数λ为1,即拟合误差项和L 1范数正则化项对求解目标函数最小值具有同等重要的贡献。
2 地震加速度数据与基线漂移噪声模型的选取
本文设计了一组试验来验证提出的基于L 1范数正则化方法识别基线漂移位置和漂移程度的可靠性和精确性。首先,选择合适的地震动加速度记录作为原始记录,加入已知的人工基线漂移噪声;其次,用本文方法对加完噪声后的数据进行处理以计算出加速度基线漂移,将其求解得到的基线漂移与人工加入的已知基线漂移噪声进行对比,以此来测试新方法对加速度时程中的基线漂移有效识别的程度;最后,通过原始数据与加入噪声处理后的速度和位移的比较,检验新方法对于速度和位移时程的恢复效果。
本文选用Akkar 和Boore (2009)在讨论基于蒙特卡罗方法识别典型基线漂移噪声模型的基线校正方案中所采用的地震记录,以及工程应用上最为常用的El Centro 波,作为测试基于L 1范数正则化基线校正方法识别人工基线漂移噪声的原始地震记录。相应的数据从美国太平洋地震工程研究中心(Pacific Earthquake Engineering Research Center ,简写为PEER )强震数据114地 震 学 报41 卷
库下载,这些记录已进行了仪器校准、基线校正和滤波处理。限于篇幅,本文仅以1999年集集地震TCU129台南北分量,1999年土耳其迪兹杰(Duzce )地震Bolu 台东西分量和1940年美国帝王谷(Imperial Valley )地震的El Centro Array #9台的南北分量(即El Centro 波)为例,具体信息列于表1,其中,事前部分(地震波P 波到时)采用Allen (1978,1982)提出的P 波捡拾方法—长短时平均算法(STA/LTA )计算得出,其余信息来自PEER (2013)的NGA-West2中的地震元数据。
对于加速度基线漂移噪声模型,根据Akkar 和Boore (2009)提出的典型加速度基线漂移噪声可概括为4类:单段式、两段式、多段式和斜线式。Wang 等(2011a )、彭小波等(2011)和荣棉水等(2014)在对现有基线校正方法总结后认为,相对于简单的单段式和复杂的多段式,两段式是基线校正方法中最为普遍采用的基线漂移模型。在两段式加速度基线漂移校正方法中,广为使用的是Iwan 等(1985)提出的两段式校正方法及其改进方法(于海英等,2009;Wang et al ,2011a ,2013)、修正方法(Boore ,2001,2005;Wu ,Wu ,2007;Chao et al ,2010;荣棉水等,2014;Jones et a
l ,2017)。考虑到基线漂移的常见形式,以及L 1范数正则化所求解出来的基线漂移形式是分段线性函数(由L 1范数的稀疏性决定),本文选择单段式、两段式和多段式的加速度基线漂移噪声模型,如图1所示。
Iwan 等(1985)认为加速度记录在第一次和最后一次大于50 m/s 2时刻(分别记为t 1,t 2)的强烈震动区间[t 1,t 2]最有可能发生基线漂移,而从加速度记录的最初时刻t b 到第一次大于50 m/s 2时刻t 1一般不发生漂移,而漂移发生后会持续到记录最终时刻t e 。本文在具体设置基线漂移噪声模型参数时,参考Akkar 和Boore (2009)提出的典型加速度基线漂移模型,但对其幅值进行了适当调整。其中,单段式噪声模型在加速度记录的[t 1,t e ]区间漂移量a f 保持为表 1 本文所列地震记录信息(PEER ,2013)
Table 1 Information about digital accelerograms shown in this study (PEER ,2013)
发震年
地震M W P 波到时/s 持时/s 分量方向台站名称场地类型*震中距/km 1940
帝王谷地震6.950.0440NS El Centro Array#9D 12.991999
迪兹杰地震7.145.3956EW Bolu D 41.271999集集地震7.6220.6590NS TCU129C 14.16注:场地类型采
用美国地震减灾计划(National Earthquake Hazards Reduction Program ,NEHRP )给出的A ,B ,C ,D 和E 等5类场地条件划分类型(Huang et al ,2010).
图 1 本文采用的典型加速度基线漂移噪声模型(修改自Akkar ,Boore ,2009)
t b 和t e 分别为加速度记录的起、止时刻,t 1和t 2分别为加速度绝对值在第一次和最后一次大于50 m/s 2时刻,t 3为[t 1,t 2]
中间时刻,a m1和a m2分别为加速度在强烈震动时段的加速度漂移幅值,a f 为加速度最终保持的漂移幅值
Fig . 1 Representative sketches of acceleration baseline-offset noise models (modified from Akkar ,Boore ,2009)
t b and t e are respectively the beginning and ending of the recording , the time t 1 and t 2 represent the first and last time that
the recording’s absolute values are larger than 50 m/s 2, t 3 is the medium time between t 1 and t 2,a m1 and a m2 mean
the two consecutive constant offsets during the strong ground shaking ,a f is the final offset
1 期熊政辉等:基于L 1范数正则化的强震动加速度记录基线漂移识别方法115
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论