使用shell脚本实现文本拆分--688IT编程网

使⽤shell脚本实现⽂本拆分需求说明

在bash中，我们可以使⽤split命令轻松实现⽂本的拆分。现在增加两点需求：

1. 在每份拆分⽂件的头部插⼊title，便于查看。

2. 拆分⽂件的名称为源⽂件名称前加编号，如。

总体思路

1. 执⾏split命令，把源⽂件按指定⾏数拆分成若⼲⼩⽂件。

2. 遍历这些⼩⽂件，并创建名称符合要求的拆分⽂件，然后插⼊title并拷贝⽂件内容。

具体步骤

1. ⾸先执⾏如下命令，⼈⼯造出⼀个包含9999⾏的⼤⽂件。

echo"" | awk'BEGIN{for (i = 0; i < 9999; i++) print(201503200001+i)".jpg"}' >

2. 假设指定⾏数为3000，执⾏如下命令，这个⽂件将被拆成4个⼩⽂件。

split -l

得到的4个⼩⽂件名称分别为xaa, xab, xac, xad。

3. 现在逐个创建名称符合要求的⼩⽂件，并往⽂件中存内容，像下⾯这样：

echo"#photo_file_name">

cat xaa>>

4. 最好能把冗余的⽂件删除，因此在完成第3步后执⾏rm xaa命令。

5. 主体已经有了，现在需要把它们拼起来形成⼀个shell脚本。

创建脚本⽂件split.sh并在vi中打开：

touch split.sh

chmod +x split.sh

vi split.sh

编辑split.sh，输⼊以下内容：

#!/bin/bash

# 1. 参数检查

if [ $# -ne 2 ]; then

echo -e "wrong parameter\nUsage: $0 filename linecount";

exit 1;

# 2. 拆分⽂件

# 2.1清掉可能的旧⽂件

rm -f x??

rm -f *.$1

# 2.2执⾏拆分

split -l $2 $1

# 3. 遍历⼩⽂件

xfiles=$(ls x??)

index=1

for current_file in $xfiles; do

new_file=$index.$1

touch $new_file

# 写⼊title和内容

echo"#photo_file_name">$new_file

cat $current_file>>$new_file

# 删除冗余⽂件

rm -f $current_file

# 打印⼩⽂件摘要

echo"~~~ $new_file";

head -3 $new_file

echo"......"

tail -2 $new_file

echo""

# ⽂件索引加1

index=$(($index+1))

done

运⾏效果

widea@cnblogs:~/demo $ ./split. 3000

~~~

#photo_file_name

201503200001.jpg

201503200002.jpg

shell创建文件并写入内容......

201503202999.jpg

201503203000.jpg

~~~

#photo_file_name

201503203001.jpg

201503203002.jpg

......

201503205999.jpg

201503206000.jpg

~~~

#photo_file_name

201503206001.jpg

201503206002.jpg

......

201503208999.jpg

201503209000.jpg

~~~

#photo_file_name

201503209001.jpg

201503209002.jpg

......

201503209998.jpg

201503209999.jpg

widea@cnblogs:~/demo $ ls

split.sh

⼩提⽰

1. shell脚本对空格敏感，赋值时不能留空格，⽐如xfiles = $(ls x??)就是错误的。

2. 变量的引⽤必须⽤$符号。

3. 当出现syntax error: unexpected end of file错误，请把注意⼒放在syntax error，⼤多数情况下是脚本语法错误。(当然也不排除⽂件格式的问题，可在vi中输⼊:set fileformat查看⽂件格式是否为unix。)

688IT编程网

使用shell脚本实现文本拆分

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

使用shell脚本实现文本拆分

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式