详解Sed命令的⽤法与正则表达式元字符
sed命令⽤法
sed是⼀种流编辑器,它是⽂本处理中⾮常有⽤的⼯具,能够完美的配合正则表达式使⽤,功能不同凡响。处理时,把当前处理的⾏存储在临时缓冲区中,称为『模式空间』(pattern space),接着⽤sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下⼀⾏,这样不断重复,直到⽂件末尾。⽂件内容并没有改变,除⾮你使⽤重定向存储输出。sed主要⽤来⾃动编辑⼀个或多个⽂件,简化对⽂件的反复操作,编写转换程序等。
1.简介
sed是⾮交互式的编辑器。它不会修改⽂件,除⾮使⽤shell重定向来保存结果。默认情况下,所有的输出⾏都被打印到屏幕上。
sed编辑器逐⾏处理⽂件(或输⼊),并将结果发送到屏幕。具体过程如下:⾸先sed把当前正在处理的⾏保存在⼀个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的⾏,完成后把该⾏发送到屏幕上。sed每处理完⼀⾏就将其从临时缓冲区删除,然后将下⼀⾏读⼊,进⾏
处理和显⽰。处理完输⼊⽂件的最后⼀⾏后,sed便结束运⾏。sed把每⼀⾏都存在临时缓冲区中,对这个副本进⾏编辑,所以不会修改原⽂件。
2.定址
定址⽤于决定对哪些⾏进⾏编辑。地址的形式可以是数字、正则表达式、或⼆者的结合。如果没有指定地址,sed将处理输⼊⽂件的所有⾏。
地址是⼀个数字,则表⽰⾏号;是“$"符号,则表⽰最后⼀⾏。例如:sed -n '$p' /etc/issue
3.命令与选项
sed命令告诉sed如何处理由地址指定的各输⼊⾏,如果没有指定地址则处理所有的输⼊⾏。
3.1 sed命令
a\
在当前⾏后添加⼀⾏或多⾏。多⾏时除最后⼀⾏外,每⾏末尾需⽤“\”续⾏ -a,只是显⽰,如果要真的更改⽂本,就要sed -
i.bak '' 这样就会出来⼀个带bak格式的⽂件,这个⽂件是源⽂件
[root@entos74 app]#cat - | sed '10,20a\ 11 adadadadadada '
c\
⽤此符号后的新⽂本替换当前⾏中的⽂本。多⾏时除最后⼀⾏外,每⾏末尾需⽤"\"续⾏
cat - | sed '10c\XXXXXXXXXXXXXXXXXX'
i\
在当前⾏之前插⼊⽂本。多⾏时除最后⼀⾏外,每⾏末尾需⽤"\"续⾏
cat - | sed '10i\XXXXXXXXXXXXXXXXXX'
d
删除⾏:ss -ntl |sed '1d' 删除第⼀⾏
h
把模式空间⾥的内容复制到暂存缓冲区
H
把模式空间⾥的内容追加到暂存缓冲区
g
把暂存缓冲区⾥的内容复制到模式空间,覆盖原有的内容
G
把暂存缓冲区的内容追加到模式空间⾥,追加在原有内容的后⾯
p
打印当前模式空间内容,追加到默认输出之后
n
读⼊下⼀输⼊⾏,并从下⼀条命令⽽不是第⼀条命令开始对其的处理
q
结束或退出sed
r
从⽂件中读取输⼊⾏
!
对所选⾏以外的所有⾏应⽤命令
s
⽤⼀个字符串替换另⼀个
g
在⾏内进⾏全局替换:cat - | sed 's@/bin/bash$@ /sbin/nologin@g'
w
将所选的⾏写⼊⽂件:sed '/^lixiaozi/w /'
x
交换暂存缓冲区与模式空间的内容
y
将字符替换为另⼀字符(不能对正则表达式使⽤y命令)
3.2 sed选项
选项
功能
-e
进⾏多项编辑,即对输⼊⾏应⽤多条sed命令时使⽤
-n
取消默认的输出
-f
指定sed脚本的⽂件名
4.退出状态
sed不向grep⼀样,不管是否到指定的模式,它的退出状态都是0。只有当命令存在语法错误时,sed的退出状态才不是0。
5.正则表达式元字符
与grep⼀样,sed也⽀持特殊元字符,来进⾏模式查、替换。不同的是,sed使⽤的正则表达式是括在斜杠线"/"之间的模式。
如果要把正则表达式分隔符"/"改为另⼀个字符,⽐如o,只要在这个字符前加⼀个反斜线,在字符后跟上正则表达式,再跟上这个字符即可。例如:sed -n '\o^Myop' datafile
元字符
功能
⽰例
^
⾏⾸定位符
/^my/ 匹配所有以my开头的⾏
$
⾏尾定位符
/my$/ 匹配所有以my结尾的⾏
.
匹配除换⾏符以外的单个字符
/m..y/ 匹配包含字母m,后跟两个任意字符,再跟字母y的⾏
*
匹配零个或多个前导字符
/
正则匹配符号+数字结尾字符串my*/ 匹配包含字母m,后跟零个或多个y字母的⾏
[]
匹配指定字符组内的任⼀字符
/[Mm]y/ 匹配包含My或my的⾏
[^]
匹配不在指定字符组内的任⼀字符
/[^Mm]y/ 匹配包含y,但y之前的那个字符不是M或m的⾏
\(..\)
保存已匹配的字符
1,20s/\(you\)self/\1r/ 标记元字符之间的模式,并将其保存为标签1,之后可以使⽤\1来引⽤它。最多可以定义9个标签,从左边开始编号,最左边的是第⼀个。此例中,对第1到第20⾏进⾏处理,you被保存为标签1,如果发现youself,则替换为your。 &
保存查串以便在替换串中引⽤
s/my/**&**/ 符号&代表查串。my将被替换为**my**
\<
词⾸定位符
/\<my/ 匹配包含以my开头的单词的⾏
\>
词尾定位符
/my\>/ 匹配包含以my结尾的单词的⾏
x\{m\}
连续m个x
/9\{5\}/ 匹配包含连续5个9的⾏
x\{m,\}
⾄少m个x
/9\{5,\}/ 匹配包含⾄少连续5个9的⾏
x\{m,n\}
⾄少m个,但不超过n个x
/9\{5,7\}/ 匹配包含连续5到7个9的⾏
6.范例
6.1 p命令
命令p⽤于显⽰模式空间的内容。默认情况下,sed把输⼊⾏打印在屏幕上,选项-n⽤于取消默认的打印操作。当选项-n和命令p同时出现时,sed可打印选定的内容。
sed '/my/p' datafile
#默认情况下,sed把所有输⼊⾏都打印在标准输出上。如果某⾏匹配模式my,p命令将把该⾏另外打印⼀遍。
[root@entos74 ~]#sed -n '3p'
只打印第三⾏
只显⽰指定⾏范围的⽂件内容,例如:
# 只查看⽂件的第20⾏到第30⾏,并且带上⾏号
cat -n /etc/passwd | sed -n '20,30p'
6.2 d命令
命令d⽤于删除输⼊⾏。sed先将输⼊⾏从⽂件复制到模式空间⾥,然后对该⾏执⾏sed命令,最后将模式空间⾥的内容显⽰在屏幕上。如果发出的是命令d,当前模式空间⾥的输⼊⾏会被删除,不被显⽰。
sed '$d' datafile
#删除最后⼀⾏,其余的都被显⽰
cat - | sed '/mail/,25d'
#删除包含"mail"的⾏到第25⾏的内容
地址是逗号分隔的,那么需要处理的地址是这两⾏之间的范围(包括这两⾏在内)。范围可以⽤数字、正则表达式、或⼆者的组合表⽰。例如:
sed '2,5d' datafile
#删除第⼆到第五⾏
sed '/My/,/You/d' datafile
#删除包含"My"的⾏到包含"You"的⾏之间的⾏
6.3 s命令
sed 's/^My/You/g' datafile
#命令末端的g表⽰在⾏内进⾏全局替换,也就是说如果某⾏出现多个My,所有的My都被替换为You。
6.4 e选项
-e是编辑命令,⽤于sed执⾏多个编辑任务的情况下。在下⼀⾏开始编辑前,所有的编辑动作将应⽤到模式缓冲区中的⾏上。sed -e '1,10d' -e 's/My/Your/g' datafile
#选项-e⽤于进⾏多重编辑。第⼀重编辑删除第1-3⾏。第⼆重编辑将出现的所有My替换为Your。因为是逐⾏进⾏这两项编辑(即这两个命令都在模式空间的当前⾏上执⾏),所以编辑命令的顺序会影响结果。
6.5 w命令
sed -n '/hrwang/' datafile
6.6 a\ 命令
a\ 命令是追加命令,追加将添加新⽂本到⽂件中当前⾏(即读⼊模式缓冲区中的⾏)的后⾯。所追加的⽂本⾏位于sed命令的下⽅另起⼀⾏。如果要追加的内容超过⼀⾏,则每⼀⾏都必须以反斜线结束,最后⼀⾏除外。最后⼀⾏将以引号和⽂件名结束。
sed '/^hrwang/a\
>hrwang and mjfan are husband\
>and wife' datafile
#如果在datafile⽂件中发现匹配以hrwang开头的⾏,则在该⾏下⾯追加hrwang and mjfan are husband and wife
6.7 i\ 命令
i\ 命令是在当前⾏的前⾯插⼊新的⽂本。
6.8 c\ 命令
sed使⽤该命令将已有⽂本修改成新的⽂本。
6.9 n命令
sed使⽤该命令获取输⼊⽂件的下⼀⾏,并将其读⼊到模式缓冲区中,任何sed命令都将应⽤到匹配⾏紧接着的下⼀⾏上。sed '/hrwang/{n;s/My/Your/;}' datafile
总结
以上所述是⼩编给⼤家介绍的详解Sed命令的⽤法与正则表达式元字符,希望对⼤家有所帮助,如果⼤家有任何疑问请给我留⾔,⼩编会及时回复⼤家的。在此也⾮常感谢⼤家对⽹站的⽀持!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论