sed正则表达式讲解(很不错)
sed是⼀种流编辑器,它是⽂本处理中⾮常中的⼯具,能够完美的配合正则表达式使⽤,功能不同凡响。处理时,把当前处理的⾏存储在临时缓冲区中,称为“模式空间”(pattern space),接着⽤sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下⼀⾏,这样不断重复,直到⽂件末尾。⽂件内容并没有改变,除⾮你使⽤重定向存储输出。Sed主要⽤来⾃动编辑⼀个或多个⽂件;简化对⽂件的反复操作;编写转换程序等。
sed的选项、命令、替换标记
命令格式
sed [options] '' (s)
sed [options] -f scriptfile file(s)
-e<script>或--expression=<script>:以选项中的指定的script来处理输⼊的⽂本⽂件;
-f<script⽂件>或--file=<script⽂件>:以选项中指定的script⽂件来处理输⼊的⽂本⽂件;
-h或--:显⽰帮助;
-n或--quiet或——silent:仅显⽰script处理后的结果;
-V或--version:显⽰版本信息。
⽂件:指定待处理的⽂本⽂件列表。
a\ 在当前⾏下⾯插⼊⽂本。
i\ 在当前⾏上⾯插⼊⽂本。
c\ 把选定的⾏改为新的⽂本。
d 删除,删除选择的⾏。
D 删除模板块的第⼀⾏。
s 替换指定字符
h 拷贝模板块的内容到内存中的缓冲区。
H 追加模板块的内容到内存中的缓冲区。
g 获得内存缓冲区的内容,并替代当前模板块中的⽂本。
G 获得内存缓冲区的内容,并追加到当前模板块⽂本的后⾯。
l 列表不能打印字符的清单。
n 读取下⼀个输⼊⾏,⽤下⼀个命令处理新的⾏⽽不是⽤第⼀个命令。
N 追加下⼀个输⼊⾏到模板块后⾯并在⼆者间嵌⼊⼀个新⾏,改变当前⾏号码。
p 打印模板块的⾏。
P(⼤写) 打印模板块的第⼀⾏。
q 退出Sed。
b lable 分⽀到脚本中带有标记的地⽅,如果分⽀不存在则分⽀到脚本的末尾。
r file 从file中读⾏。
t label if分⽀,从最后⼀⾏开始,条件⼀旦满⾜或者T,t命令,将导致分⽀到带有标号的命令处,或者到脚本的末尾。
T label 错误分⽀,从最后⼀⾏开始,⼀旦发⽣错误或者T,t命令,将导致分⽀到带有标号的命令处,或者到脚本的末尾。
file 写并追加模板块到file末尾。
W file 写并追加模板块的第⼀⾏到file末尾。
! 表⽰后⾯的命令对所有没有被选定的⾏发⽣作⽤。
= 打印当前⾏号码。
# 把注释扩展到下⼀个换⾏符以前。
g 表⽰⾏内全⾯替换。
p 表⽰打印⾏。
w 表⽰把⾏写⼊⼀个⽂件。
x 表⽰互换模板块中的⽂本和缓冲区中的⽂本。
y 表⽰把⼀个字符翻译为另外的字符(但是不⽤于正则表达式)
\1 ⼦串匹配标记
& 已匹配字符串标记
^ 匹配⾏开始,如:/^sed/匹配所有以sed开头的⾏。
$ 匹配⾏结束,如:/sed$/匹配所有以sed结尾的⾏。
. 匹配⼀个⾮换⾏符的任意字符,如:/s.d/匹配s后接⼀个任意字符,最后是d。
* 匹配0个或多个字符,如:/*sed/匹配所有模板是⼀个或多个空格后紧跟sed的⾏。
[] 匹配⼀个指定范围内的字符,如/[]/匹配sed和Sed。
[^] 匹配⼀个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的⼀个字母开头,紧跟ed的⾏。\(..\) 匹配⼦串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。
& 保存搜索字符⽤来替换其他字符,如s/love/**&**/,love这成**love**。
\< 匹配单词的开始,如:/\<love/匹配包含以love开头的单词的⾏。
\> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的⾏。
x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的⾏。
x\{m,\} 重复字符x,⾄少m次,如:/0\{5,\}/匹配⾄少有5个0的⾏。
x\{m,n\} 重复字符x,⾄少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的⾏。
sed⽤法实例
替换⽂本中的字符串:
sed 's/book/books/' file
-n选项和p命令⼀起使⽤表⽰只打印那些发⽣替换的⾏:
sed -n 's//TEST/p' file
直接编辑⽂件选项-i,会匹配file⽂件中每⼀⾏的第⼀个book替换为books:
sed -i 's/book/books/g' file
使⽤后缀 /g 标记会替换每⼀⾏中的所有匹配:
regex匹配
sed 's/book/books/g' file
当需要从第N处匹配开始替换时,可以使⽤ /Ng:
sksksksksksk | sed 's/sk/SK/2g'
skSKSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/3g'
skskSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/4g'
skskskSKSKSK
以上命令中字符 / 在sed中作为定界符使⽤,也可以使⽤任意的定界符:
sed 's:test:TEXT:g'
sed 's|test|TEXT|g'
定界符出现在样式内部时,需要进⾏转义:
sed 's/\/bin/\/usr\/local\/bin/g'
删除空⽩⾏:
sed '/^$/d' file
删除⽂件的第2⾏:
sed '2d' file
删除⽂件的第2⾏到末尾所有⾏:
sed '2,$d' file
删除⽂件最后⼀⾏:
sed '$d' file
删除⽂件中所有开头是test的⾏:
sed '/^test/'d file
正则表达式 \w\+ 匹配每⼀个单词,使⽤ [&] 替换它,& 对应于之前所匹配到的单词:
echo this is a test line | sed 's/\w\+/[&]/g'
[this] [is] [a] [test] [line]
所有以192.168.0.1开头的⾏都会被替换成它⾃已加localhost:
sed 's/^192.168.0.1/&localhost/' file
192.168.0.1localhost
匹配给定样式的其中⼀部分:
echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/'
this is 7 in a number
命令中 digit 7,被替换成了 7。样式匹配到的⼦串是 7,\(..\) ⽤于匹配⼦串,对于匹配到的第⼀个⼦串就标记为 \1,依此类推匹配到的第⼆个结果就是 \2,例如:
echo aaa BBB | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2\1/'
BBB aaa
love被标记为1,所有loveable会被替换成lovers,并打印出来:
sed -n 's/\(love\)able/\1rs/p' file
sed '表达式' | sed '表达式'
等价于:
sed '表达式;表达式'
sed表达式可以使⽤单引号来引⽤,但是如果表达式内部包含变量字符串,就需要使⽤双引号。
test=hello
echo hello WORLD | sed "s/$test/HELLO"
HELLO WORLD
所有在模板test和check所确定的范围内的⾏都被打印:
sed -n '/test/,/check/p' file
打印从第5⾏开始到第⼀个包含以test开始的⾏之间的所有⾏:
sed -n '5,/^test/p' file
对于模板test和west之间的⾏,每⾏的末尾⽤字符串aaa bbb替换:
sed '/test/,/west/s/$/aaa bbb/' file
-e选项允许在同⼀⾏⾥执⾏多条命令:
sed -e '1,5d' -e 's/test/check/' file
上⾯sed表达式的第⼀条命令删除1⾄5⾏,第⼆条命令⽤check替换test。命令的执⾏顺序对结果有影响。如果两个命令都是替换命令,那么第⼀个替换命令将影响第⼆个替换命令的结果。
和 -e 等价的命令是 --expression:
sed --expression='s/test/check/' --expression='/love/d' file
file⾥的内容被读进来,显⽰在与test匹配的⾏后⾯,如果匹配多⾏,则file的内容将显⽰在所有匹配⾏的下⾯:
sed '/test/r file' filename
在example中所有包含test的⾏都被写⼊file⾥:
sed -n '/test/w file' example
将 this is a test line 追加到以test 开头的⾏后⾯:
sed '/^test/a\this is a test line' file
在 f ⽂件第2⾏之后插⼊ this is a test line:
sed -i '2a\this is a test line' f
将 this is a test line 追加到以test开头的⾏前⾯:
sed '/^test/i\this is a test line' file
在f⽂件第5⾏之前插⼊this is a test line:
sed -i '5i\this is a test line' f
如果test被匹配,则移动到匹配⾏的下⼀⾏,替换这⼀⾏的aa,变为bb,并打印该⾏,然后继续:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论