• Linux 下文本查找技巧你掌握了吗?


    前言

    之前介绍过很多linux下查找相关的命令,例如《Linux中的文件查找技巧》,《find命令高级用法》,《如何查看linux中文件打开情况-lsof命令》等等,而对文件内容搜索的命令似乎还没有涉及,因此本文介绍文本搜索命令--grep。

    本文最新地址Linux grep命令实例详解

    常见用法

    我们会经常结合管道符(|)来使用它,即在前面命令执行的结果中查找包含相关字符串的内容。例如:

    $ ps -ef|grep redis

    ps -ef用于查看系统进程情况,但是它列出的结果很多,如果我们只想看到自己需要的,则通过管道符,用grep进行过滤搜索,例如搜索redis相关的进程,最后它只会列出和redis相关的进程了:

    $  ps -ef|grep redis
    root     10748 10733  0 21:14 pts/21   00:00:00 redis-server *:6379
    root     10754 10733  0 21:14 pts/21   00:00:00 grep --color=auto redis

    那么如果要排除某些不相关信息呢?我们可以使用-v参数

    $ ps -ef|grep redis |grep -v auto
    root     10748 10733  0 21:14 pts/21   00:00:00 redis-server *:6379

    这样一来,包含auto相关的结果就不会出现在最终结果里了。

    如果只想统计结果数量呢?我们可以结合-c(count)参数:

    $ ps -ef|grep redis -c
    2

    文件内容搜索

    好了,说完了最常见的用法,我们来看看如何搜索文件内容。实际上awk和sed在这方面也颇有经验,不过本文的主角是grep,所以另外两个命令暂时不涉及。我们来看几个实例。

    在指定文件中查找指定关键字

    例如,要在linux_command_debug.md文件中,查找test字符串:

    $  grep "test" aaa/bbb/linux_command_debug.md
    int test(int a,int b)
        test(a,b);

    如果想要显示指定关键字的行号,可以使用-n参数,例如:

    $  grep -n "test" aaa/bbb/linux_command_debug.md
    18:int test(int a,int b)
    27:    test(a,b);

    搜索时指定或排除多个文件

    前面提到了对一个文件内容进行搜索,如果是多个呢?或者不想从某些文件里搜索呢?

    如果想对文件进行指定也是可以的,例如搜索所有的md结尾的文件:

    $  grep -n "test" *.md

    或者可以使用--exclude参数来排除某些文件,例如,查找包含test,但是排除txt文件:

    $ grep -rn "test" --exclude=*.txt

    搜索时就会忽略.txt结尾的文件了。

    如果要排序的条件比较多,可以将要排除的条件存储在另外一个文件里:

    $ grep -rn "test" --exclude-from=skip.txt

    skip.txt的内容可以是模式匹配的文件名或者具体文件名:

    *.txt
    test.md

    这样,以.txt结尾,以及test.md文件都不会搜索了。

    除此之外,还可以排除或指定目录,它需要用到--exclude-dir参数:

    $ grep -rn "test" --exclude-dir=aaa

    它在搜索时将会跳过aaa目录下的文件。

    查找包含指定关键字的文件

    如果要在当前目录下所有文件查找包含“int main(void)”字符串的文件:

    $ grep -rn "int main(void)"
    aaa/bbb/c_main_func.md:49:int main(void)
    aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
    aaa/bbb/c_array.md:104:int main(void)
    aaa/bbb/c_array.md:129:int main(void)
    aaa/bbb/pc-lint.md:42:int main(void)
    aaa/bbb/pc-lint.md:128:int main(void)

    这可能是最实用的使用方法之一了。这里-r参数表示递归查找当前目录的文件,-n会显示查找位置的行号,如果只想显示包含该指定关键字的文件名,可使用-l(--file-with-matches)参数:

    $ grep -rln "int main(void)"
    aaa/bbb/c_main_func.md
    aaa/bbb/c_array.md
    aaa/bbb/pc-lint.md

    如果你尝试一下就会发现,如果不带-r参数,它会暂停,等待你从控制台输入,例如:

    $ grep -n "test"
    test
    1:test

    所以使用时记得带上相关参数奥!

    查找不包含指定关键字的文件

    前面提到了如何查找包含某个字符的文件,如果要找的是不包含该字符的文件呢?
    实际上只要使用-L参数即可:

    $ grep -rLn "int main(void)"
    (这里会显示不包含指定关键字内容的文件名)

    搜索时忽略大小写

    使用-i(--ignore-case)参数即可:

    $ grep -rni "int MAIN(void)"
    aaa/bbb/c_main_func.md:49:int main(void)
    aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
    aaa/bbb/c_array.md:104:int main(void)
    aaa/bbb/c_array.md:129:int main(void)
    aaa/bbb/pc-lint.md:42:int main(void)
    aaa/bbb/pc-lint.md:128:int main(void)

    搜索显示不包含指定关键字的行

    前面的大部分例子都是显示符合条件的行,如果要显示不符合条件的行呢?可以用我们前面提到的-v参数:

    $ grep -rnv "int main(void)"
    (内容较多,未显示)

    从结果中就会发现,它会展示出包含指定关键字的文件,但是展示的是不包含该字符串的行。

    显示指定关键字前后内容

    假如你需要查看包含指定关键字行附近的行,前面的方式是没有办法看到的,不过我们可以用-A(--after-context=)和-B(--before-context=)参数来显示前后的行:

    $ grep -rn "int main(void)" -A 1 -B 1
    aaa/bbb/c_array.md-103-}
    aaa/bbb/c_array.md:104:int main(void)
    aaa/bbb/c_array.md-105-{
    (其他内容省略)

    通过最后加上-A和-B参数,显示了指定关键字前面的行,这在日志搜索分析时非常有用。

    指定规则文件进行搜索

    如果有多个搜索关键字怎么处理呢?我们可以把关键字写在一个文件,搜索时指定文件即可,例如规则文件为key.txt:

    int main(void)
    test

    从指定文件中搜索上面的关键字:

    $ cat filename |grep -f key.txt

    这样结果就会显示匹配key.txt文件中所有关键字的行,非常适合用于多个条件的搜索。

    正则表达式搜索

    看完前面的内容,是不是还没有感受到grep的强大,grep的另一个强大之处是,它的搜索支持正则表达式,例如查找文本行以t开头,以t结尾的文件:

    $ grep -rn ^t.*t$
    key.txt:2:test
    aaa/bbb/c_operate_redis_start.md:68:typedef struct Stu_Info_Struct
    aaa/bbb/c_operate_redis_start.md:101:typedef struct Stu_Info_Struct

    其中^t,表明以t开头,t$表明以t结尾,如果需要使用扩展的正则表达式进行搜索,可使用egrep命令。关于正则表达式的写法,本文不做详细介绍。

    总结

    在内容搜索方面,grep常常能够助我们一臂之力,因此掌握grep的使用也是linux学习不可缺少的一部分,当然我们不需要完全记住每个参数的作用,但我们至少知道有这样的参数,并且在需要时能够快速查询到。本文常用参数如下:

    • -v #显示不包含匹配关键字的所有行。
    • -l #显示包含匹配关键字的文件
    • -L #显示不包含匹配关键字的文件
    • -r #递归搜索
    • -i #忽略大小写
    • -n #显示关键字所在行号
    • -A n #显示关键字后n行
    • -B n #显示关键字前n行
    • --exclude #搜索时排除某些文件
    • --exclude-dir #搜索时排除某些目录
    • -f #指定规则文件进行搜索

    本文最新地址Linux grep命令实例详解

    微信公众号【编程珠玑】:专注但不限于分享计算机编程基础,Linux,C语言,C++,数据结构与算法,工具,资源等编程相关[原创]技术文章,号内包含大量经典电子书和视频学习资源。欢迎一起交流学习,一起修炼计算机“内功”,知其然,更知其所以然。

    公众号编程珠玑公众号编程珠玑
  • 相关阅读:
    Linux alias 设置快捷命令,打包
    网站改版了
    团队建设经典故事
    easyui中jquery重复引用问题(tab内存泄露问题)
    EasyUI 兼容 IE6 方法总结
    EasyUI datagrid frozencolumn的bug???
    docker-compose快速部署环境笔记
    MySQL获取距离
    Jenkins Publish FTP远程部署过程
    慎用uniapp开发商业级应用
  • 原文地址:https://www.cnblogs.com/bianchengzhuji/p/10969936.html
Copyright © 2020-2023  润新知