文章目录
在处理文本文件时,经常需要在一个或多个文件中查找并替换文本字符串。
sed
是一个轻量级stream流编辑器。它可以对文件和输入流(例如管道)执行基本的文本操作。您可以使用它搜索,查找和替换,插入和删除单词和行。它支持基本和扩展的正则表达式,使您可以匹配复杂的模式。
在本文中,我们将讨论如何使用查找和替换字符串sed
。我们还将向您展示如何执行递归搜索和替换。
sed
查找并替换字符串
有多个版本sed
,它们之间在功能上有所不同。macOS使用BSD版本,并且大多数Linux发行版均默认预装有GNU sed
。我们将使用GNU版本。
使用搜索和替换文本的一般形式采用sed
以下形式:
sed -i 's/SEARCH_REGEX/REPLACEMENT/g' INPUTFILE
-
-i
-默认情况下,sed
将其输出写入标准输出。此选项告诉sed
直接编辑文件。如果提供了扩展名(例如-i.bak),将创建原始文件的备份。 -
s
-替换命令,可能是sed中最常用的命令。 -
/ / /
-分隔符。它可以是任何字符,但通常使用斜杠(/
)字符。 -
SEARCH_REGEX
-要搜索的普通字符串或正则表达式。 -
REPLACEMENT
-替换字符串。 -
g
-全局替换标志。默认情况下,sed
逐行读取文件,并且仅更改文件行中第一次出现的SEARCH_REGEX
。提供替换标志后,所有匹配都将被替换。 -
INPUTFILE
-要在其上运行命令的文件的名称。
良好的做法是在引号周围加上引号,以使Shell元字符不会转义。
让我们看一下如何使用sed
命令搜索和替换文件中一些最常用的选项和标志的示例。
出于演示目的,我们将使用以下文件:
file.txt
123 Foo foo foo
foo /bin/bash Ubuntu foobar 456
如果省略g
标志,则仅替换每行中搜索字符串的第一个实例:
sed -i 's/foo/linux/' file.txt
123 Foo linux foo
linux /bin/bash Ubuntu foobar 456
使用全局替换标志sed
替换所有出现的搜索模式:
sed -i 's/foo/linux/g' file.txt
123 Foo linux linux
linux /bin/bash Ubuntu linuxbar 456
您可能已经注意到,在前面的示例中,字符串foo
内的子foobar
字符串也被替换了。如果这不是想要的行为,请在搜索字符串的两端使用单词边界表达式\b
。这样可以确保部分单词不匹配。
sed -i 's/\bfoo\b/linux/g' file.txt
123 Foo linux linux
linux /bin/bash Ubuntu foobar 456
要使模式匹配不区分大小写,请使用该I
标志。在下面的示例中,我们同时使用g
和I
标志:
sed -i 's/foo/linux/gI' file.txt
123 linux linux linux
linux /bin/bash Ubuntu linuxbar 456
如果要查找并替换包含定界符(/
)的字符串,则需要使用反斜杠(\
)来转义斜杠。例如替换/bin/bash
为/usr/bin/zsh
您将使用
sed -i 's/\/bin\/bash/\/usr\/bin\/zsh/g' file.txt
更简单易读的选项是使用另一个定界符。大多数人使用竖线(|
)或冒号(:
),但您可以使用其他任何字符:
sed -i 's|/bin/bash|/usr/bin/zsh|g' file.txt
123 Foo foo foo
foo /usr/bin/zsh Ubuntu foobar 456
您也可以使用正则表达式。例如,搜索所有3位数字并将其替换为number
您要使用的字符串:
sed -i 's/\b[0-9]\{3\}\b/number/g' file.txt
number Foo foo foo
foo /bin/bash demo foobar number
sed的另一个有用功能是您可以使用&
与匹配模式相对应的&字符。该字符可以多次使用。
例如,如果要在每个3位数字周围添加花括号{}
,请键入:
sed -i 's/\b[0-9]\{3\}\b/{&}/g' file.txt
{123} Foo foo foo
foo /bin/bash demo foobar {456}
最后但并非最不重要的一点是,使用编辑文件时进行备份总是一个好主意sed
。为此,只需提供-i
选项的扩展即可。例如,要编辑file.txt
和保存原始文件,file.txt.bak
请使用以下方法:
sed -i.bak 's/foo/linux/g' file.txt
如果要确保已创建备份,请使用以下ls
命令列出文件:
ls
file.txt file.txt.bak
递归查找和替换
有时您想递归地在目录中搜索包含字符串的文件,并替换所有文件中的字符串。这可以通过使用诸如find
或命令grep
来递归,在目录中查找文件并将文件名传递到sed
来完成。
以下命令将递归搜索当前工作目录中的文件,并将文件名传递给sed
。
find . -type f -exec sed -i 's/foo/bar/g' {} +
为避免文件名中包含空格的问题,请使用-print0
选项,该选项告诉find
打印文件名,后跟一个空字符,然后将输出通过管道传递给 xargs -0
:
find . -type f -print0 | xargs -0 sed -i 's/foo/bar/g'
要排除目录,请使用-not -path
选项。例如,如果要替换本地git repo中的字符串以排除所有以点(.
)开头的文件,请使用:
find . -type f -not -path '*/\.*' -print0 | xargs -0 sed -i 's/foo/bar/g'
如果只想搜索和替换具有特定扩展名的文件上的文本,则可以使用:
find . -type f -name "*.md" -print0 | xargs -0 sed -i 's/foo/bar/g'
另一种选择是使用grep
命令以递归方式查找包含搜索模式的所有文件,然后将文件名通过管道传递给sed
:
grep -rlZ 'foo' . | xargs -0 sed -i.bak 's/foo/bar/g'
结论
尽管看似复杂,但一开始,使用sed
来搜索和替换文件中的文本非常简单。
要了解有关sed
命令,选项和标志的更多信息,请访问GNU sed手册和Grymoire sed教程。如果您有任何问题或反馈,请随时发表评论。