linux shell脚本中如何自由操作字符串--688IT编程网

linux shell脚本中如何自由操作字符串

Bash所支持的字符串操作的数量多的令人惊讶. 但是不幸的是, 这些工具缺乏统一的标准. 一些是参数替换的子集, 而另外一些则受到UNIX expr命令的影响. 这就导致了命令语法的不一致, 还会引起冗余的功能, 但是这些并没有引起混乱.

字符串长度

${#string}

expr length $string

expr "$string" : '.*'

1 stringZ=abcABC123ABCabc

3 echo ${#stringZ} # 15

4 echo `expr length $stringZ` # 15

5 echo `expr "$stringZ" : '.*'` # 15

--------------------------------------------------------------------------------

例子 9-10. 在一个文本文件的段落之间插入空行

1 #!/bin/bash

2 # paragraph-space.sh

4 # 在一个单倍行距的文本文件中插入空行.

5 # Usage: $0 <FILENAME

7 MINLEN=45 # 可能需要修改这个值.

8 # 假定行的长度小于$MINLEN所指定的长度的时候

9 #+ 才认为此段结束.

11 while read line # 提供和输入文件一样多的行...

12 do

13 echo "$line" # 输入所读入的行本身.

15 len=${#line}

16 if [ "$len" -lt "$MINLEN" ]

17 then echo # 在短行(译者注: 也就是小于$MINLEN个字符的行)后面添加一个空行.

18 fi

19 done

21 exit 0

--------------------------------------------------------------------------------

匹配字符串开头的子串长度

expr match "$string" '$substring'

$substring是一个正则表达式.

expr "$string" : '$substring'

$substring是一个正则表达式.

1 stringZ=abcABC123ABCabc

2 # |------|

4 echo `expr match "$stringZ" 'abc[A-Z]*.2'` # 8

5 echo `expr "$stringZ" : 'abc[A-Z]*.2'` # 8

索引

expr index $string $substring

在字符串$string中所匹配到的$substring第一次所出现的位置.

1 stringZ=abcABC123ABCabc

2 echo `expr index "$stringZ" C12` # 6

3 # C 字符的位置.

5 echo `expr index "$stringZ" 1c` # 3

6 # 'c' (in #3 position) matches before '1'.

这与C语言中的strchr()函数非常相似.

提取子串

${string:position}

在$string中从位置$position开始提取子串.

如果$string是"*"或者"@", 那么将会提取从位置$position开始的位置参数. [1]

${string:position:length}

在$string中从位置$position开始提取$length长度的子串.

1 stringZ=abcABC123ABCabc

2 #

3 # 0-based indexing.

5 echo ${stringZ:0} # abcABC123ABCabc

6 echo ${stringZ:1} # bcABC123ABCabc

7 echo ${stringZ:7} # 23ABCabc

9 echo ${stringZ:7:3} # 23A

10 # 提取子串长度为3.

14 # 能不能从字符串的右边(也就是结尾)部分开始提取子串?

16 echo ${stringZ:-4} # abcABC123ABCabc

17 # 默认是提取整个字符串, 就象${parameter:-default}一样.

18 # 然而 . . .

20 echo ${stringZ:(-4)} # Cabc

21 echo ${stringZ: -4} # Cabc

22 # 这样, 它就可以工作了.

23 # 使用圆括号或者添加一个空格可以"转义"这个位置参数.

25 # 感谢, Dan Jacobson, 指出这点.

如果$string参数是"*"或"@", 那么将会从$position位置开始提取$length个位置参数, 但是由于可能没有$length个位置参数了, 那么就有几个位置参数就提取几个位置参数.

1 echo ${*:2} # 打印出第2个和后边所有的位置参数.

2 echo ${@:2} # 同上.

4 echo ${*:2:3} # 从第2个开始, 连续打印3个位置参数.

expr substr $string $position $length

在$string中从$position开始提取$length长度的子串.

1 stringZ=abcABC123ABCabc

2 #

3 # 以1开始计算.

5 echo `expr substr $stringZ 1 2` # ab

6 echo `expr substr $stringZ 4 3` # ABC

expr match "$string" '$$substring$'

从$string的开始位置提取$substring, $substring是正则表达式.

expr "$string" : '$$substring$'

从$string的开始位置提取$substring, $substring是正则表达式.

1 stringZ=abcABC123ABCabc

2 # =======

4 echo `expr match "$stringZ" '$.[b-c]*[A-Z]..[0-9]$'` # abcABC1

5 echo `expr "$stringZ" : '$.[b-c]*[A-Z]..[0-9]$'` # abcABC1

6 echo `expr "$stringZ" : '$.......$'` # abcABC1

7 # 上边的每个echo都打印出相同的结果.

expr match "$string" '.*$$substring$'

从$string的结尾提取$substring, $substring是正则表达式.

expr "$string" : '.*$$substring$'

从$string的结尾提取$substring, $substring是正则表达式.

1 stringZ=abcABC123ABCabc

2 # ======

4 echo `expr match "$stringZ" '.*$[A-C][A-C][A-C][a-c]*$'` # ABCabc

5 echo `expr "$stringZ" : '.*$......$'` # ABCabc

子串削除

${string#substring}

从$string的开头位置截掉最短匹配的$substring.

${string##substring}

从$string的开头位置截掉最长匹配的$substring.

1 stringZ=abcABC123ABCabc

2 # |----|

3 # |----------|

5 echo ${stringZ#a*C} # 123ABCabc

6 # 截掉'a'到'C'之间最短的匹配字符串.

8 echo ${stringZ##a*C} # abc

9 # 截掉'a'到'C'之间最长的匹配字符串.

${string%substring}

从$string的结尾位置截掉最短匹配的$substring.

${string%%substring}

从$string的结尾位置截掉最长匹配的$substring.

1 stringZ=abcABC123ABCabc

2 # ||

3 # |------------|

echo ${stringZ%b*c} # abcABC123ABCa

6 # 从$stringZ的结尾位置截掉'b'到'c'之间最短的匹配.

8 echo ${stringZ%%b*c} # a

9 # 从$stringZ的结尾位置截掉'b'到'c'之间最长的匹配.

当你需要构造文件名的时候, 这个操作就显得特别有用.

--------------------------------------------------------------------------------

例子 9-11. 转换图片文件格式, 同时更改文件名

1 #!/bin/bash

2 # cvt.sh:

3 # 将一个目录下的所有MacPaint格式的图片文件都转换为"pbm"各式的图片文件.

5 # 使用"netpbm"包中的"macptopbm"程序进行转换,

6 #+ 这个程序主要是由Brian Henderson(bryanh@giraffe-data)来维护的.

7 # Netpbm绝大多数Linux发行版的标准套件.

9 OPERATION=macptopbm

10 SUFFIX=pbm # 新的文件名后缀.

12 if [ -n "$1" ]

13 then

14 directory=$1 # 如果目录名作为参数传递给脚本...

15 else

16 directory=$PWD # 否则使用当前的工作目录.

17 fi

19 # 假定目标目录中的所有文件都是MacPaint格式的图像文件,

20 #+ 并且都是以".mac"作为文件名后缀.

22 for file in $directory/* # 文件名匹配(filename globbing).

23 do

24 filename=${file%.*c} # 去掉文件名的".mac"后缀

25 #+ ('.*c' 将会匹配

26 #+ '.'和'c'之间任意字符串).

27 $OPERATION $file > "$filename.$SUFFIX"

28 # 把结果重定向到新的文件中.

29 rm -f $file # 转换后删除原始文件.

30 echo "$filename.$SUFFIX" # 从stdout输出转换后文件的文件名.

31 done

33 exit 0

35 # 练习:

36 # -----

37 # 就像它现在的样子, 这个脚本把当前

38 #+ 目录下的所有文件都转换了.

39 # 修改这个脚本, 让它只转换以".mac"为后缀名的文件.

--------------------------------------------------------------------------------

例子 9-12. 将音频流文件转换为ogg各式的文件

1 #!/bin/bash

2 # ra2ogg.sh: 将音频流文件(*.ra)转换为ogg格式的文件.

4 # 使用"mplayer"媒体播放器程序:

5 # www.mplayerhq.hu/homepage

6 # 可能需要安装合适的编解码程序(codec)才能够正常的运行这个脚本.

7 # 需要使用"ogg"库和"oggenc":

8 # /

11 OFILEPREF=${1%%ra} # 去掉"ra"后缀.

12 OFILESUFF=wav # wav文件的后缀.

13 OUTFILE="$OFILEPREF""$OFILESUFF"

14 E_NOARGS=65

16 if [ -z "$1" ] # 必须要指定一个需要转换的文件名.

17 then

18 echo "Usage: `basename $0` [filename]"

19 exit $E_NOARGS

20 fi

23 >>>>>>>>>>>>>>####

mplayer "$1" -ao pcm:file=$OUTFILE

25 oggenc "$OUTFILE" # oggenc编码后会自动加上正确的文件扩展名.

26 >>>>>>>>>>>>>>####

28 rm "$OUTFILE" # 删除中介的*.wav文件.

29 # 如果你想保留这个文件的话, 可以把上边这行注释掉.

31 exit $?

33 # 注意:

34 # ----

35 # 在网站上, 简单的在*.ram流音频文件上单击的话,

36 #+ 一般都只会下载真正音频流文件(就是*.ra文件)的URL.

37 # 你可以使用"wget"或者一些类似的工具

38 #+ 来下载*.ra文件本身.

41 # 练习:

42 # -----

43 # 像上面所看到的, 这个脚本只能够转换*.ra文件.

44 # 给这个脚本添加一些灵活性, 让它能够转换*.ram and other filenames.

45 #

46 # 如果你觉得这还不过瘾, 那么你可以扩展这个脚本,

47 #+ 让它自动下载并转换音频流文件.

48 # 给出一个URL, (使用"wget")批处理下载音频流文件,

49 #+ 然后转换它们.

--------------------------------------------------------------------------------

一个简单的getopt命令的模拟, 使用子串提取结构.

--------------------------------------------------------------------------------

例子 9-13. 模拟getopt

1 #!/bin/bash

2 # getopt-simple.sh

3 # 作者: Chris Morgan

4 # 已经经过授权, 可以使用在本书中.

7 getopt_simple()

8 {

9 echo "getopt_simple()"

10 echo "Parameters are '$*'"

11 until [ -z "$1" ]

12 do

13 echo "Processing parameter of: '$1'"

14 if [ ${1:0:1} = '/' ]

15 then

16 tmp=${1:1} # 去掉开头的'/' . . .

17 parameter=${tmp%%=*} # 提取参数名.

18 value=${tmp##*=} # 提取参数值.

19 echo "Parameter: '$parameter', value: '$value'"

20 eval $parameter=$value

21 fi

22 shift

23 done

24 }

26 # 把所有选项传给函数getopt_simple().

27 getopt_simple $*

29 echo "test is '$test'"

30 echo "test2 is '$test2'"

32 exit 0

34 ---

36 sh getopt_example.sh /test=value1 /test2=value2

38 Parameters are '/test=value1 /test2=value2'

39 Processing parameter of: '/test=value1'

40 Parameter: 'test', value: 'value1'

41 Processing parameter of: '/test2=value2'

42 Parameter: 'test2', value: 'value2'

43 test is 'value1'

44 test2 is 'value2'

--------------------------------------------------------------------------------

子串替换

${string/substring/replacement}

使用$replacement来替换第一个匹配的$substring.

${string//substring/replacement}

使用$replacement来替换所有匹配的$substring.

1 stringZ=abcABC123ABCabc

3 echo ${stringZ/abc/xyz} # xyzABC123ABCabc

4 # 使用'xyz'来

替换第一个匹配的'abc'.

6 echo ${stringZ//abc/xyz} # xyzABC123ABCxyz

7 # 用'xyz'来替换所有匹配的'abc'.

${string/#substring/replacement}

如果$substring匹配$string的开头部分, 那么就用$replacement来替换$substring.

shell最简单脚本

${string/%substring/replacement}

如果$substring匹配$string的结尾部分, 那么就用$replacement来替换$substring.

1 stringZ=abcABC123ABCabc

3 echo ${stringZ/#abc/XYZ} # XYZABC123ABCabc

4 # 用'XYZ'替换开头的'abc'.

6 echo ${stringZ/%abc/XYZ} # abcABC123ABCXYZ

7 # 用'XYZ'替换结尾的'abc'.

9.2.1. 使用awk来处理字符串

Bash脚本也可以调用awk的字符串操作功能来代替它自己内建的字符串操作.

--------------------------------------------------------------------------------

例子 9-14. 提取字符串的另一种方法

1 #!/bin/bash

2 # substring-extraction.sh

4 String=23skidoo1

5 # 012345678 Bash

6 # 123456789 awk

7 # 注意不同的字符串索引系统:

8 # Bash的第一个字符是从'0'开始记录的.

9 # Awk的第一个字符是从'1'开始记录的.

11 echo ${String:2:4} # 位置 3 (0-1-2), 4 个字符长

12 # skid

14 # awk中等价于${string:pos:length}的命令是substr(string,pos,length).

15 echo | awk '

16 { print substr("'"${String}"'",3,4) # skid

17 }

18 '

19 # 使用一个空的"echo"通过管道传递给awk一个假的输入,

20 #+ 这样就不必提供一个文件名给awk.

22 exit 0

macOS终端中的Shell脚本编程入门

« 上一篇

实验三shell相关实验

688IT编程网

linux shell脚本中如何自由操作字符串

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

linux shell脚本中如何自由操作字符串

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式