• Linux常用命令03 grep


    grep 命令代表“全局正则表达式 print” ,它是 Linux 中最强大和最常用的命令之一。

    1mxfNj
    grep 在一个或多个输入文件中搜索与给定模式匹配的行,并将每个匹配行写入标准输出。 如果没有指定文件,grep 将从标准输入读取,这通常是另一个命令的输出。

    在本文中,我们将通过实例和对最常见的 GNU grep 选项的详细说明,向您展示如何使用 grep 命令。
    Bm1gUK

    grep 命令语法

    grep 命令的语法如下:

    grep [OPTIONS] PATTERN [FILE...]
    

    方括号中的项目是可选的。

    OPTIONS - 既然可选,就是可以要可不要。
    PATTERN - 搜寻模式
    FILE - 零个或多个输入文件名

    为了能够搜索该文件,运行该命令的用户必须具有对该文件的读访问权。

    搜索文件中的字符串

    grep 命令最基本的用法是在文件中搜索字符串(文本)。

    For example, to display all the lines containing the string bash from the /etc/passwd file, you would run the following command:

    例如,要显示/etc/passwd 文件中包含字符串 bash 的所有行,可以运行以下命令:

    grep bash /etc/passwd
    

    输出应该是这样的:

    root:x:0:0:root:/root:/bin/bash
    linuxize:x:1000:1000:linuxize:/home/linuxize:/bin/bash
    

    如果字符串包含空格,需要用单引号或双引号将其括起来:

    grep "Gnome Display Manager" /etc/passwd
    

    反相匹配(排除)

    若要显示与模式不匹配的行,请使用-v (或 --invert-match)选项。

    例如,要打印不包含字符串 nologin 的行,可以使用:

    grep -v nologin /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    colord:x:124:124::/var/lib/colord:/bin/false
    git:x:994:994:git daemon user:/:/usr/bin/git-shell
    linuxize:x:1000:1000:linuxize:/home/linuxize:/bin/bash
    

    使用 grep 筛选命令的输出

    命令的输出可以通过管道使用 grep 进行过滤,并且只有与给定模式匹配的行才会打印在终端上。

    例如,要查找系统中作为用户 www-data 运行的进程,可以使用以下 ps 命令:

    ps -ef | grep www-data
    www-data 18247 12675  4 16:00 ?        00:00:00 php-fpm: pool www
    root     18272 17714  0 16:00 pts/0    00:00:00 `grep` --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-dir=.hg --exclude-dir=.svn www-data
    www-data 31147 12770  0 Oct22 ?        00:05:51 nginx: worker process
    www-data 31148 12770  0 Oct22 ?        00:00:00 nginx: cache manager process
    

    您还可以根据命令连接多个管道。 正如您在上面的输出中看到的,还有一行包含 grep 进程。 如果不希望显示该行,则将输出传递给另一个 grep 实例,如下所示。

    ps -ef | grep www-data | grep -v grep
    www-data 18247 12675  4 16:00 ?        00:00:00 php-fpm: pool www
    root     18272 17714  0 16:00 pts/0    00:00:00 `grep` --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-dir=.hg --exclude-dir=.svn www-data
    www-data 31147 12770  0 Oct22 ?        00:05:51 nginx: worker process
    www-data 31148 12770  0 Oct22 ?        00:00:00 nginx: cache manager process
    

    递归搜索

    要递归搜索模式,可以使用 -r 选项(或 --recursive)调用 grep。 当使用此选项时,grep 将搜索指定目录中的所有文件,递归地跳过遇到的符号链接。

    若要跟踪所有符号链接,请使用-R 选项,而不是-r。

    下面的示例演示如何在/etc 目录中的所有文件中搜索字符串 chasays.github.io:

    grep -r chasays.github.io /etc
    

    输出将包括以文件的完整路径为前缀的匹配行:

    /etc/hosts:127.0.0.1 node2.chasays.github.io
    /etc/nginx/sites-available/chasays.github.io:    server_name chasays.github.io   www.chasays.github.io;
    

    如果使用-r 选项,grep 将跟随所有符号链接:
    grep -R chasays.github.io /etc
    注意下面输出的最后一行。 当使用-rmr 调用 grep 时,不会打印该行,因为 Nginx 启用站点的目录中的文件是到 sites-available 目录中的配置文件的符号链接。

    /etc/hosts:127.0.0.1 node2.chasays.github.io
    /etc/nginx/sites-available/chasays.github.io:    server_name chasays.github.io   chasays.github.io;
    /etc/nginx/sites-enabled/chasays.github.io:    server_name chasays.github.io   chasays.github.io;
    

    只显示文件名

    若要禁止默认 grep 输出并只打印包含匹配模式的文件名,请使用-l (或 --files-with-matches)选项。

    下面的命令搜索所有以。 在当前工作目录中输出包含字符串 linuxize. com 的文件名:

    grep -l chasays.github.io *.conf
    

    输出结果如下:

    tmux.conf
    haproxy.conf
    

    The -l option is usually used in combination with the recursive option -R:

    -l 选项通常与递归选项 -R 结合使用:

    grep -Rl chasays.github.io /tmp
    

    不区分大小写的搜索

    默认情况下,grep 区分大小写,这意味着大小写字符被视为不同字符。

    若要在搜索时忽略大小写,请使用-i 选项(或 --ignore-case)调用 grep

    例如,当搜索没有任何选项的 Zebra 时,下面的命令不会显示任何输出,即有匹配的行:

    grep Zebra /usr/share/words
    

    但是如果使用-i 选项执行不区分大小写的搜索,它将匹配大小写字母:

    grep -i Zebra /usr/share/words
    

    指定“ Zebra”将匹配“ Zebra”、“ Zebra”或该字符串的任何其他大小写字母组合。

    zebra
    zebra's
    zebras
    

    搜索全文

    在搜索字符串时,grep 将显示字符串嵌入较大字符串中的所有行。

    例如,如果搜索“ gnu” ,所有“ gnu”嵌入在较大单词中的行,如“ cygnus”或“ magnum”将被匹配:

    grep gnu /usr/share/words
    
    cygnus
    gnu
    interregnum
    lgnu9d
    lignum
    magnum
    magnuson
    sphagnum
    wingnut
    

    若要仅返回指定字符串为整个单词(由非单词字符括起来)的那些行,请使用-w (或 --word-regexp)选项。

    字符包括字母数字字符(a-z, A-Z, and ,及0-9) ( )及下划线(_). 所有其他字符都视为非字符

    如果您运行与上面相同的命令(包括 -w 选项) ,grep 命令将只返回 gnu 作为单独的单词包含的那些行。

    grep -w gnu /usr/share/words
    gnu
    

    显示行号

    -n (或 --line-number)选项告诉 grep 显示包含与模式匹配的字符串的行的行号。 使用此选项时,grep 将匹配内容打印到以行号为前缀的标准输出。

    例如,要显示/etc/services 文件中包含以匹配行号作为前缀的字符串 bash 的行,可以使用以下命令:

    grep -n 10000 /etc/services
    

    下面的输出显示匹配项在第10423和10424行。

    10423:ndmp            10000/tcp
    10424:ndmp            10000/udp
    

    计数匹配

    若要将匹配行数打印到标准输出,请使用 -c (或 --count)选项。

    在下面的示例中,我们计算了将/usr/bin/zsh 作为 shell 的帐户数量。

    grep -c '/usr/bin/zsh' /etc/passwd
    
    4
    

    安静模式

    Q (或 --quiet)告诉 grep 在安静模式下运行,不要在标准输出上显示任何内容。 如果找到匹配项,则该命令退出状态为0。 在 shell 脚本中使用 grep 时,这非常有用,您希望检查文件是否包含字符串,并根据结果执行特定操作。

    下面是一个在静默模式下使用 grep 作为 if 语句中的测试命令的示例:

    if `grep` -q PATTERN filename
    then
        echo pattern found
    else
        echo pattern not found
    fi
    

    基本正则表达式

    Gnugrep 有三个正则表达式特性集,Basic、 Extended 和 perl 兼容。

    默认情况下,grep 将模式解释为基本正则表达式,其中除元字符外的所有字符实际上都是匹配自身的正则表达式。

    下面是最常用的元字符列表:

    使用 ^ (插入符号)符号来匹配行开头的表达式。 在下面的示例中,只有当字符串 kangaroo 出现在行的开头时,它才会匹配。

    grep "^kangaroo" file.txt
    

    使用 $(dollar)符号来匹配行尾的表达式。 在下面的示例中,只有当字符串 kangaroo 出现在行的末尾时,它才会匹配。

    grep "kangaroo$" file.txt
    

    使用。 (句号)符号来匹配任何单个字符。 例如,要匹配以 kan 开头,然后有两个字符和以字符串 roo 结尾的任何内容,您可以使用以下模式:

    grep "kan..roo" file.txt
    

    使用匹配括在方括号中的任何单个字符。 例如,找到包含 accept 或者 accent 的行,你可以使用以下模式:

    grep "acce[np]t" file.txt
    

    使用 ^ 匹配括在方括号中的任何单个字符。 下面的模式将匹配包含 co (除了 l 以外的任何字母) a 的任何字符串组合,如可可、钴等,但不匹配包含可乐的线,

    grep "co[^l]a" file.txt
    
    

    若要转义下一个字符的特殊含义,请使用(反斜杠)符号。

    扩展的正则表达式

    若要将模式解释为扩展正则表达式,请使用-e (或 --extended-regexp)选项。 扩展的正则表达式包括所有基本元字符,以及用于创建更复杂、更强大的搜索模式的附加元字符。 以下是一些例子:

    匹配并提取给定文件中的所有电子邮件地址:

    grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" file.txt
    

    匹配并提取给定文件中的所有有效 IP 地址:

    grep -E -o '(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)' file.txt
    

    O 选项仅用于打印匹配的字符串。

    搜索多个字符串(模式)

    可以使用 OR 操作符 | 连接两个或多个搜索模式。

    默认情况下,grep 将模式解释为一个基本的正则表达式,其中 | 等元字符失去了它们的特殊含义,必须使用它们的反斜线版本。

    在下面的例子中,我们正在 Nginx 日志错误文件中搜索出现的词汇 fatal,error,critical:

    grep 'fatal\|error\|critical' /var/log/nginx/error.log
    

    如果使用扩展正则表达式选项-e,则不应转义运算符 | ,如下所示:

    grep -E 'fatal|error|critical' /var/log/nginx/error.log
    

    在匹配之前打印行

    若要在匹配行之前打印特定行数,请使用-b (或 --before-context)选项。

    例如,要在匹配行之前显示五行前导上下文,可以使用以下命令:

    grep -B 5 root /etc/passwd
    

    zwEsXm

    匹配后打印行

    若要在匹配行之后打印特定行数,请使用 -a (或 --after-context)选项。

    例如,要在匹配行之后显示五行尾随上下文,可以使用以下命令:

    grep -A 5 root /etc/passwd
    

    hnWXx0

    小结

    grep 命令允许您在文件内搜索模式。 如果找到匹配项,grep 将打印包含指定模式的行。
    grep 用户手册页面上有很多关于 grep 的信息。

    https://www.gnu.org/software/grep/manual/grep.html

  • 相关阅读:
    【前端积累】Awesome初识
    【Python系列】Python3获取控制台输入
    【linux系列】Centos下安装mysql数据库
    Intellij 部署项目java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener
    【大数据系列】节点的退役和服役[datanode,yarn]
    【大数据系列】使用api修改hadoop的副本数和块大小
    【规范】alibaba编码规范阅读
    【大数据系列】hadoop上传文件报错_COPYING_ could only be replicated to 0 nodes
    【分布式系列之ActiveMq】ActiveMq入门示例
    类的生命周期
  • 原文地址:https://www.cnblogs.com/ievjai/p/14382650.html
Copyright © 2020-2023  润新知