Linux常用命令03 grep - 润新知

Linux常用命令03 grep
grep 命令代表“全局正则表达式 print” ，它是 Linux 中最强大和最常用的命令之一。

grep 在一个或多个输入文件中搜索与给定模式匹配的行，并将每个匹配行写入标准输出。如果没有指定文件，grep 将从标准输入读取，这通常是另一个命令的输出。

在本文中，我们将通过实例和对最常见的 GNU grep 选项的详细说明，向您展示如何使用 grep 命令。

grep 命令语法

grep 命令的语法如下:
```
grep [OPTIONS] PATTERN [FILE...]
```
方括号中的项目是可选的。

OPTIONS - 既然可选，就是可以要可不要。
PATTERN - 搜寻模式
FILE - 零个或多个输入文件名

为了能够搜索该文件，运行该命令的用户必须具有对该文件的读访问权。

搜索文件中的字符串

grep 命令最基本的用法是在文件中搜索字符串(文本)。

For example, to display all the lines containing the string bash from the /etc/passwd file, you would run the following command:

例如，要显示/etc/passwd 文件中包含字符串 bash 的所有行，可以运行以下命令:
```
grep bash /etc/passwd
```
输出应该是这样的:
```
root:x:0:0:root:/root:/bin/bash
linuxize:x:1000:1000:linuxize:/home/linuxize:/bin/bash
```
如果字符串包含空格，需要用单引号或双引号将其括起来:
```
grep "Gnome Display Manager" /etc/passwd
```
反相匹配(排除)

若要显示与模式不匹配的行，请使用-v (或 --invert-match)选项。

例如，要打印不包含字符串 nologin 的行，可以使用:
```
grep -v nologin /etc/passwd
root:x:0:0:root:/root:/bin/bash
colord:x:124:124::/var/lib/colord:/bin/false
git:x:994:994:git daemon user:/:/usr/bin/git-shell
linuxize:x:1000:1000:linuxize:/home/linuxize:/bin/bash
```
使用 grep 筛选命令的输出

命令的输出可以通过管道使用 grep 进行过滤，并且只有与给定模式匹配的行才会打印在终端上。

例如，要查找系统中作为用户 www-data 运行的进程，可以使用以下 ps 命令:
```
ps -ef | grep www-data
www-data 18247 12675  4 16:00 ?        00:00:00 php-fpm: pool www
root     18272 17714  0 16:00 pts/0    00:00:00 `grep` --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-dir=.hg --exclude-dir=.svn www-data
www-data 31147 12770  0 Oct22 ?        00:05:51 nginx: worker process
www-data 31148 12770  0 Oct22 ?        00:00:00 nginx: cache manager process
```
您还可以根据命令连接多个管道。正如您在上面的输出中看到的，还有一行包含 grep 进程。如果不希望显示该行，则将输出传递给另一个 grep 实例，如下所示。
```
ps -ef | grep www-data | grep -v grep
www-data 18247 12675  4 16:00 ?        00:00:00 php-fpm: pool www
root     18272 17714  0 16:00 pts/0    00:00:00 `grep` --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-dir=.hg --exclude-dir=.svn www-data
www-data 31147 12770  0 Oct22 ?        00:05:51 nginx: worker process
www-data 31148 12770  0 Oct22 ?        00:00:00 nginx: cache manager process
```
递归搜索

要递归搜索模式，可以使用 -r 选项(或 --recursive)调用 grep。当使用此选项时，grep 将搜索指定目录中的所有文件，递归地跳过遇到的符号链接。

若要跟踪所有符号链接，请使用-R 选项，而不是-r。

下面的示例演示如何在/etc 目录中的所有文件中搜索字符串 chasays.github.io:
```
grep -r chasays.github.io /etc
```
输出将包括以文件的完整路径为前缀的匹配行:
```
/etc/hosts:127.0.0.1 node2.chasays.github.io
/etc/nginx/sites-available/chasays.github.io:    server_name chasays.github.io   www.chasays.github.io;
```
如果使用-r 选项，grep 将跟随所有符号链接:
grep -R chasays.github.io /etc
注意下面输出的最后一行。当使用-rmr 调用 grep 时，不会打印该行，因为 Nginx 启用站点的目录中的文件是到 sites-available 目录中的配置文件的符号链接。
```
/etc/hosts:127.0.0.1 node2.chasays.github.io
/etc/nginx/sites-available/chasays.github.io:    server_name chasays.github.io   chasays.github.io;
/etc/nginx/sites-enabled/chasays.github.io:    server_name chasays.github.io   chasays.github.io;
```
只显示文件名

若要禁止默认 grep 输出并只打印包含匹配模式的文件名，请使用-l (或 --files-with-matches)选项。

下面的命令搜索所有以。在当前工作目录中输出包含字符串 linuxize. com 的文件名:
```
grep -l chasays.github.io *.conf
```
输出结果如下:
```
tmux.conf
haproxy.conf
```
The -l option is usually used in combination with the recursive option -R:

-l 选项通常与递归选项 -R 结合使用:
```
grep -Rl chasays.github.io /tmp
```
不区分大小写的搜索

默认情况下，grep 区分大小写，这意味着大小写字符被视为不同字符。

若要在搜索时忽略大小写，请使用-i 选项(或 --ignore-case)调用 grep。

例如，当搜索没有任何选项的 Zebra 时，下面的命令不会显示任何输出，即有匹配的行:
```
grep Zebra /usr/share/words
```
但是如果使用-i 选项执行不区分大小写的搜索，它将匹配大小写字母:
```
grep -i Zebra /usr/share/words
```
指定“ Zebra”将匹配“ Zebra”、“ Zebra”或该字符串的任何其他大小写字母组合。
```
zebra
zebra's
zebras
```
搜索全文

在搜索字符串时，grep 将显示字符串嵌入较大字符串中的所有行。

例如，如果搜索“ gnu” ，所有“ gnu”嵌入在较大单词中的行，如“ cygnus”或“ magnum”将被匹配:
```
grep gnu /usr/share/words

cygnus
gnu
interregnum
lgnu9d
lignum
magnum
magnuson
sphagnum
wingnut
```
若要仅返回指定字符串为整个单词(由非单词字符括起来)的那些行，请使用-w (或 --word-regexp)选项。

字符包括字母数字字符(a-z, A-Z, and ，及0-9) ( )及下划线(_). 所有其他字符都视为非字符

如果您运行与上面相同的命令(包括 -w 选项) ，grep 命令将只返回 gnu 作为单独的单词包含的那些行。
```
grep -w gnu /usr/share/words
gnu
```
显示行号

-n (或 --line-number)选项告诉 grep 显示包含与模式匹配的字符串的行的行号。使用此选项时，grep 将匹配内容打印到以行号为前缀的标准输出。

例如，要显示/etc/services 文件中包含以匹配行号作为前缀的字符串 bash 的行，可以使用以下命令:
```
grep -n 10000 /etc/services
```
下面的输出显示匹配项在第10423和10424行。
```
10423:ndmp            10000/tcp
10424:ndmp            10000/udp
```
计数匹配

若要将匹配行数打印到标准输出，请使用 -c (或 --count)选项。

在下面的示例中，我们计算了将/usr/bin/zsh 作为 shell 的帐户数量。
```
grep -c '/usr/bin/zsh' /etc/passwd

4
```
安静模式

Q (或 --quiet)告诉 grep 在安静模式下运行，不要在标准输出上显示任何内容。如果找到匹配项，则该命令退出状态为0。在 shell 脚本中使用 grep 时，这非常有用，您希望检查文件是否包含字符串，并根据结果执行特定操作。

下面是一个在静默模式下使用 grep 作为 if 语句中的测试命令的示例:
```
if `grep` -q PATTERN filename
then
    echo pattern found
else
    echo pattern not found
fi
```
基本正则表达式

Gnugrep 有三个正则表达式特性集，Basic、 Extended 和 perl 兼容。

默认情况下，grep 将模式解释为基本正则表达式，其中除元字符外的所有字符实际上都是匹配自身的正则表达式。

下面是最常用的元字符列表:

使用 ^ (插入符号)符号来匹配行开头的表达式。在下面的示例中，只有当字符串 kangaroo 出现在行的开头时，它才会匹配。
```
grep "^kangaroo" file.txt
```
使用 $(dollar)符号来匹配行尾的表达式。在下面的示例中，只有当字符串 kangaroo 出现在行的末尾时，它才会匹配。
```
grep "kangaroo$" file.txt
```
使用。 (句号)符号来匹配任何单个字符。例如，要匹配以 kan 开头，然后有两个字符和以字符串 roo 结尾的任何内容，您可以使用以下模式:
```
grep "kan..roo" file.txt
```
使用匹配括在方括号中的任何单个字符。例如，找到包含 accept 或者 accent 的行，你可以使用以下模式:
```
grep "acce[np]t" file.txt
```
使用 ^ 匹配括在方括号中的任何单个字符。下面的模式将匹配包含 co (除了 l 以外的任何字母) a 的任何字符串组合，如可可、钴等，但不匹配包含可乐的线,
```
grep "co[^l]a" file.txt
```
若要转义下一个字符的特殊含义，请使用(反斜杠)符号。

扩展的正则表达式

若要将模式解释为扩展正则表达式，请使用-e (或 --extended-regexp)选项。扩展的正则表达式包括所有基本元字符，以及用于创建更复杂、更强大的搜索模式的附加元字符。以下是一些例子:

匹配并提取给定文件中的所有电子邮件地址:
```
grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" file.txt
```
匹配并提取给定文件中的所有有效 IP 地址:
```
grep -E -o '(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)' file.txt
```
O 选项仅用于打印匹配的字符串。

搜索多个字符串(模式)

可以使用 OR 操作符 | 连接两个或多个搜索模式。

默认情况下，grep 将模式解释为一个基本的正则表达式，其中 | 等元字符失去了它们的特殊含义，必须使用它们的反斜线版本。

在下面的例子中，我们正在 Nginx 日志错误文件中搜索出现的词汇 fatal，error，critical:
```
grep 'fatal\|error\|critical' /var/log/nginx/error.log
```
如果使用扩展正则表达式选项-e，则不应转义运算符 | ，如下所示:
```
grep -E 'fatal|error|critical' /var/log/nginx/error.log
```
在匹配之前打印行

若要在匹配行之前打印特定行数，请使用-b (或 --before-context)选项。

例如，要在匹配行之前显示五行前导上下文，可以使用以下命令:
```
grep -B 5 root /etc/passwd
```
匹配后打印行

若要在匹配行之后打印特定行数，请使用 -a (或 --after-context)选项。

例如，要在匹配行之后显示五行尾随上下文，可以使用以下命令:
```
grep -A 5 root /etc/passwd
```
小结

grep 命令允许您在文件内搜索模式。如果找到匹配项，grep 将打印包含指定模式的行。
在 grep 用户手册页面上有很多关于 grep 的信息。

https://www.gnu.org/software/grep/manual/grep.html
作者：叉叉敌
博客：https://chasays.github.io/
微信公众号：Chasays，欢迎关注一起吹牛逼，也可以加个人微信号「xxd_0225」互吹。
本博客大多为学习笔记或读书笔记，本文如对您有帮助，还请多推荐下此文，如有错误欢迎指正，相互学习，共同进步。
相关阅读:
【前端积累】Awesome初识
 【Python系列】Python3获取控制台输入
 【linux系列】Centos下安装mysql数据库
 Intellij 部署项目java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener
【大数据系列】节点的退役和服役[datanode,yarn]
【大数据系列】使用api修改hadoop的副本数和块大小
 【规范】alibaba编码规范阅读
 【大数据系列】hadoop上传文件报错_COPYING_ could only be replicated to 0 nodes
【分布式系列之ActiveMq】ActiveMq入门示例
 类的生命周期
原文地址：https://www.cnblogs.com/ievjai/p/14382650.html

Copyright © 2020-2023 润新知