在整理词库的过程中经常会遇到一个问题,有些词是同一个关键词但是有空格的话,无法正常被去重,那么有没有办法能快快速去除这些字符中间的空格呢?其实我们可以用Shell快速去除字符串中的空格。

直接上栗子,效果如下图所示,图上半部分是示例文本,下半部分就是用shell去掉空格后的效果;其中用到就是下面第3个方法。

使用Shell快速去除字符串中的空格

在Linux / Unix上使用Sed命令进行字符串处理中常常遇到的问题就是:行首行尾的空格怎么删除?

下面介绍用Sed是怎样实现的,当然awk命令可以

1、删除行首空格

sed 's/^[ \t]*//g'
注意上面\t前面有个空格的

说明: 第一个/的左边是s表示替换,即将空格替换为空 第一个/的右边是表示后面的以xx开头 中括号表示“或”,空格或tab中的任意一种。这是正则表达式的规范。 中括号右边是*,表示一个或多个。 第二个和第三个\中间没有东西,表示空 g表示替换原来buffer(缓冲区)中的,sed在处理字符串的时候并不对源文件进行直接处理,先创建一个buffer,但是加g表示对原buffer进行替换。 整体的意思是:用空字符去替换一个或多个用空格或tab开头的本体字符串

2、删除行末空格

sed 's/[ \t]*$//g'

和上面稍微有些不同是前面删除了^符,在后面加上了美元符,这表示以xx结尾的字符串为对象。 但是要注意在KSH中,Tab并不是\t而是直接打入一个Tab就可以了。

3、删除所有的空格

sed s/[[:space:]]//g
Last modification:November 8, 2019
如果觉得我的文章对你有用,请随意赞赏