如何使用sed查找和替换文件中的字符串

文章目录

在处理文本文件时,经常需要在一个或多个文件中查找并替换文本字符串。

sed是一个轻量级stream流编辑器。它可以对文件和输入流(例如管道)执行基本的文本操作。您可以使用它搜索,查找和替换,插入和删除单词和行。它支持基本和扩展的正则表达式,使您可以匹配复杂的模式。

在本文中,我们将讨论如何使用查找和替换字符串sed。我们还将向您展示如何执行递归搜索和替换。

sed查找并替换字符串

有多个版本sed,它们之间在功能上有所不同。macOS使用BSD版本,并且大多数Linux发行版均默认预装有GNU sed。我们将使用GNU版本。

使用搜索和替换文本的一般形式采用sed以下形式:

sed -i 's/SEARCH_REGEX/REPLACEMENT/g' INPUTFILE
  • -i-默认情况下,sed将其输出写入标准输出。此选项告诉sed 直接编辑文件。如果提供了扩展名(例如-i.bak),将创建原始文件的备份。
  • s -替换命令,可能是sed中最常用的命令。
  • / / /-分隔符。它可以是任何字符,但通常使用斜杠(/)字符。
  • SEARCH_REGEX -要搜索的普通字符串或正则表达式。
  • REPLACEMENT -替换字符串。
  • g-全局替换标志。默认情况下,sed逐行读取文件,并且仅更改文件行中第一次出现的SEARCH_REGEX。提供替换标志后,所有匹配都将被替换。
  • INPUTFILE -要在其上运行命令的文件的名称。

良好的做法是在引号周围加上引号,以使Shell元字符不会转义。

让我们看一下如何使用sed命令搜索和替换文件中一些最常用的选项和标志的示例。

出于演示目的,我们将使用以下文件:

file.txt

123 Foo foo foo
foo /bin/bash Ubuntu foobar 456

如果省略g标志,则仅替换每行中搜索字符串的第一个实例:

sed -i 's/foo/linux/' file.txt
123 Foo linux foo
linux /bin/bash Ubuntu foobar 456

使用全局替换标志sed替换所有出现的搜索模式:

sed -i 's/foo/linux/g' file.txt
123 Foo linux linux
linux /bin/bash Ubuntu linuxbar 456

您可能已经注意到,在前面的示例中,字符串foo内的子foobar字符串也被替换了。如果这不是想要的行为,请在搜索字符串的两端使用单词边界表达式\b。这样可以确保部分单词不匹配。

sed -i 's/\bfoo\b/linux/g' file.txt
123 Foo linux linux
linux /bin/bash Ubuntu foobar 456

要使模式匹配不区分大小写,请使用该I标志。在下面的示例中,我们同时使用gI标志:

sed -i 's/foo/linux/gI' file.txt
123 linux linux linux
linux /bin/bash Ubuntu linuxbar 456

如果要查找并替换包含定界符(/)的字符串,则需要使用反斜杠(\)来转义斜杠。例如替换/bin/bash/usr/bin/zsh您将使用

sed -i 's/\/bin\/bash/\/usr\/bin\/zsh/g' file.txt

更简单易读的选项是使用另一个定界符。大多数人使用竖线(|)或冒号(:),但您可以使用其他任何字符:

sed -i 's|/bin/bash|/usr/bin/zsh|g' file.txt
123 Foo foo foo
foo /usr/bin/zsh Ubuntu foobar 456

您也可以使用正则表达式。例如,搜索所有3位数字并将其替换为number您要使用的字符串:

sed -i 's/\b[0-9]\{3\}\b/number/g' file.txt
number Foo foo foo
foo /bin/bash demo foobar number

sed的另一个有用功能是您可以使用&与匹配模式相对应的&字符。该字符可以多次使用。

例如,如果要在每个3位数字周围添加花括号{},请键入:

sed -i 's/\b[0-9]\{3\}\b/{&}/g' file.txt
{123} Foo foo foo
foo /bin/bash demo foobar {456}

最后但并非最不重要的一点是,使用编辑文件时进行备份总是一个好主意sed。为此,只需提供-i选项的扩展即可。例如,要编辑file.txt和保存原始文件,file.txt.bak请使用以下方法:

sed -i.bak 's/foo/linux/g' file.txt

如果要确保已创建备份,请使用以下ls命令列出文件:

ls
file.txt file.txt.bak

递归查找和替换

有时您想递归地在目录中搜索包含字符串的文件,并替换所有文件中的字符串。这可以通过使用诸如find或命令grep来递归,在目录中查找文件并将文件名传递到sed来完成。

以下命令将递归搜索当前工作目录中的文件,并将文件名传递给sed

find . -type f -exec sed -i 's/foo/bar/g' {} +

为避免文件名中包含空格的问题,请使用-print0选项,该选项告诉find打印文件名,后跟一个空字符,然后将输出通过管道传递给 xargs -0

find . -type f -print0 | xargs -0 sed -i 's/foo/bar/g'

要排除目录,请使用-not -path选项。例如,如果要替换本地git repo中的字符串以排除所有以点(.)开头的文件,请使用:

find . -type f -not -path '*/\.*' -print0 | xargs -0 sed -i 's/foo/bar/g'

如果只想搜索和替换具有特定扩展名的文件上的文本,则可以使用:

find . -type f -name "*.md" -print0 | xargs -0 sed -i 's/foo/bar/g'

另一种选择是使用grep命令以递归方式查找包含搜索模式的所有文件,然后将文件名通过管道传递给sed

grep -rlZ 'foo' . | xargs -0 sed -i.bak 's/foo/bar/g'

结论

尽管看似复杂,但一开始,使用sed来搜索和替换文件中的文本非常简单。

要了解有关sed命令,选项和标志的更多信息,请访问GNU sed手册和Grymoire sed教程。如果您有任何问题或反馈,请随时发表评论。

全部为采集文章,文中的 联系方式 均不是 本人 的!

发表评论