shell删除文本中的重复行--688IT编程网

shell删除⽂本中的重复⾏

三种常见⽅法:

第⼀，⽤sort+uniq，注意，单纯uniq是不⾏的。

shell> sort -k2n file | uniq > a.out

这⾥我做了个简单的测试，当file中的重复⾏不再⼀起的时候，uniq将服务删除所有的重复⾏。经过排序后，所有相同的⾏都在相邻，因此unqi可以正常删除重复⾏。

第⼆，⽤sort+awk命令，注意，单纯awk同样不⾏，原因同上。

shell> sort -k2n file | awk ‘{if ($0!=line) print;line=$0}’

当然，⾃⼰把管道后⾯的代码重新设计⼀下，可能不需要sort命令先排序拉。

第三，⽤sort+sed命令，同样需要sort命令先排序。

shell> sort -k2n file | sed ‘$!N; /^$.*$\n\1$/!P; D’

最后附⼀个必须先⽤sort排序的⽂本的例⼦，当然，这个需要⽤sort排序的原因是很简单，就是后⾯算法设计的时候的“局部性”，相同的⾏可能分散出现在不同的区域，⼀旦有新的相同⾏出现，那么前⾯的已经出现的记录就被覆盖了，看了这个例⼦就好理解拉。

ffffffffffffffffff

eeeeeeeeeeeeeeeeeeee

fffffffffffffffffff

用sort outeeeeeeeeeeeeeeeeeeee

eeeeeeeeeeeeeeeeeeee

gggggggggggggggggggg

其实，这是我随便打进去的⼏⾏字，没想到就是必须⽤sort的很好例⼦，⼤家可以⾃⼰试试看。

发表评论

688IT编程网

shell删除文本中的重复行

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

shell删除文本中的重复行

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式