grep命令

grep命令
grep命令

grep命令用于查找文件里符合条件的字符串，如果发现某文件的内容符合所指定的模式，grep命令会把含有模式的那一行显示出来。若不指定任何文件名称，或是所给予的文件名为-，则grep指令会从标准输入设备读取数据。

语法
```
grep [OPTION]... PATTERN [FILE]...
```
参数
- -A NUM, --after-context=NUM: 在匹配行之后打印尾部上下文的NUM行，在相邻的匹配组之间放置包含--的行。
- -a, --text: 像处理文本一样处理二进制文件，这相当于--binary files=text选项。
- -B NUM, --before-context=NUM: 在匹配行之前打印前导上下文的NUM行，在相邻的匹配组之间放置包含--的行。
- -C NUM, --context=NUM: 打印输出上下文的NUM行，在相邻的匹配组之间放置包含--的行。
- -b, --byte-offset: 打印输入文件中每行输出之前的字节偏移量。
- --binary-files=TYPE: 如果文件的前几个字节指示该文件包含二进制数据，则假定该文件为类型类型。默认情况下，TYPE是binary，grep通常输出一行消息，说明二进制文件匹配，或者不输出消息(如果不匹配)。如果TYPE不匹配，grep假设二进制文件不匹配，这相当于-I选项。如果TYPE是text，grep会像处理文本一样处理二进制文件，这相当于-a选项。此外grep--binary files=text可能会输出二进制垃圾，如果输出是终端，并且终端驱动程序将其中的一些解释为命令，则会产生严重的副作用。
- --colour[=WHEN], --color[=WHEN]: 在匹配字符串周围加上标记find in GREP_COLOR环境变量，WHEN可以是never、always、auto。
- -c, --count: 禁止正常输出，而是为每个输入文件打印匹配行的计数，使用-v，--invert match选项，计算不匹配的行数。
- -D ACTION, --devices=ACTION: 如果输入文件是设备、FIFO或套接字，使用ACTION 来处理它。默认情况下，ACTION是read，这意味着设备的读取就像它们是普通文件一样，如果ACTION为skip，则设备将自动跳过。
- -d ACTION, --directories=ACTION: 如果输入文件是目录，使用ACTION来处理它。默认情况下，ACTION是read，这意味着目录的读取就像它们是普通文件一样，如果ACTION是skip，则目录将被自动跳过，如果ACTION是递归的，grep将递归地读取每个目录下的所有文件，这相当于-r选项。
- -E, --extended-regexp: 将模式解释为扩展的正则表达式。
- -e PATTERN, --regexp=PATTERN: 使用PATTERN作为模式，用于保护以-开头的模式。
- -F, --fixed-strings: 将PATTERN解释为固定字符串的列表，用换行符分隔，这些字符串可以匹配。
- -P, --perl-regexp: 将PATTERN解释为Perl正则表达式。
- -f FILE, --file=FILE: 从FILE获取模式，每行一个，空文件包含零个模式，因此不匹配。
- -G, --basic-regexp: 将PATTERN解释为基本正则表达式，这是默认值。
- -H, --with-filename: 打印每个匹配项的文件名。
- -h, --no-filename: 当搜索多个文件时，禁止在输出中使用文件名前缀。
- --help: 显示帮助文件。
- -I: 处理二进制文件，就像它不包含匹配数据一样，这相当于--binary-files=without-match选项。
- -i, --ignore-case: 忽略PATTERN和输入文件中的大小写区别。
- -L, --files-without-match: 禁止正常输出，而是打印通常不会从中打印输出的每个输入文件的名称，扫描将在第一个匹配时停止。
- -l, --files-with-matches: 禁止正常输出，而是打印通常从中打印输出的每个输入文件的名称，扫描将在第一个匹配时停止。
- -m NUM, --max-count=NUM: 在匹配行数之后停止读取文件。如果输入是来自常规文件的标准输入，并且输出NUM个匹配行，grep确保标准输入在退出之前定位到最后一个匹配行之后，而不管是否存在后续上下文行。这使调用进程能够继续(恢复)搜索，当grep在NUM个匹配行之后停止时，它输出任何后面的上下文行。当-c或--count选项也被使用时，grep不会输出大于NUM的计数。当-v或--invert match选项也被使用时，grep会在输出NUM个不匹配的行之后停止。
- --mmap: 如果可能，使用mmap系统调用来读取输入，而不是默认的读取系统调用。在某些情况下，--mmap可以产生更好的性能。但是，如果在grep操作时输入文件收缩，或者发生I/O错误，那么--mmap可能会导致未定义的行为(包括核心转储)。
- -n, --line-number: 在输出的每一行前面加上输入文件中的行号。
- -o, --only-matching: 只显示匹配行中与模式匹配的部分。
- --label=LABEL: 将实际来自标准输入的输入显示为来自文件LABEL的输入。这对于zgrep之类的工具尤其有用，例如gzip -cd foo.gz | grep -H --label = foo。
- --line-buffered: 使用行缓冲，这可能会导致性能损失。
- -q, --quiet, --silent: 保持安静，不向标准输出写入任何内容。如果找到任何匹配项，即使检测到错误，也立即退出，状态为零。
- -R, -r, --recursive: 递归地读取每个目录下的所有文件，这相当于-d recurse选项。
- -s, --no-messages: 禁止显示有关不存在或不可读文件的错误消息。
- -U, --binary: 将文件视为二进制文件。默认情况下，在MS-DOS和MS Windows下，grep通过查看从文件中读取的第一个32KB的内容来猜测文件类型。如果grep确定文件是文本文件，它将从原始文件内容中删除CR字符(以使带有^和$的正则表达式正常工作)。指定-U会推翻这种猜测，导致读取所有文件并逐字传递给匹配机制，如果文件是一个文本文件，每行末尾都有CR/LF对，这将导致某些正则表达式失败。此选项对MS-DOS和MS Windows以外的平台无效。
- -u, --unix-byte-offsets: 报告Unix样式的字节偏移量，此开关使grep报告字节偏移，就好像该文件是Unix样式的文本文件一样，即去除了CR字符。这将产生与在Unix机器上运行grep相同的结果，除非也使用-b选项，否则该选项无效。它对除MS-DOS和MS-Windows以外的平台没有影响。
- -V, --version: 输出版本信息。
- -v, --invert-match: 反转匹配的意义，以选择不匹配的行。
- -w, --word-regexp: 只选择与表单中包含的单词匹配的行。测试是匹配的子串必须在行的开头，或者前面有非单词组成字符，同样，它必须位于行的末尾，或者后跟非单词组成字符。单词组成字符是字母、数字和下划线。
- -x, --line-regexp: 仅选择与整行完全匹配的那些匹配项。
- -Z, --null: 输出零字节(ASCII NULL字符)，而不是通常在文件名后的字符。例如grep -lZ在每个文件名之后输出一个零字节，而不是通常的换行符。即使存在包含不寻常字符(例如换行符)的文件名，此选项也可以使输出明确。此选项可与find -print0、perl -0、sort -z和xargs -0等命令一起使用，以处理任意文件名，即使是包含换行符的文件名。
示例

hello.c文件内容如下:
```
#include <stdio.h>
#include <stdlib.h>

int main() {
   printf("Hello World
");
   printf("Hello World
");
   printf("Hello World
");
   return 0;
}
```
匹配带有Hello的行。
```
grep Hello hello.c
#    printf("Hello World
");
#    printf("Hello World
");
#    printf("Hello World
");
```
匹配带有Hello行的数量。
```
grep -c Hello hello.c
# 3
```
反转匹配的意义，选择不匹配Hello的行。
```
grep -v Hello hello.c
# #include <stdio.h>
# #include <stdlib.h>
#
# int main() {
#    return 0;
# }
```
匹配带有i的行并忽略大小写。
```
grep -i I hello.c
# #include <stdio.h>
# #include <stdlib.h>
# int main() {
#    printf("Hello World
");
#    printf("Hello World
");
#    printf("Hello World
");
```
仅输出与文件整行匹配的行。
```
grep -x "   return 0;" hello.c
#    return 0;
```
匹配带有Hello的行并输出行号。
```
grep -n Hello hello.c
# 5:   printf("Hello World
");
# 6:   printf("Hello World
");
# 7:   printf("Hello World
");
```
递归匹配当前目录下所有文件中能够匹配h*的文件，输出行号并忽略大小写，注意实际在终端中匹配成功的位置会使用红色字体标注。
```
grep -rni "h*" ./
# ./hello.c:1:#include <stdio.h>
# ./hello.c:2:#include <stdlib.h>
# ./hello.c:3:
# ./hello.c:4:int main() {
# ./hello.c:5:   printf("Hello World
");
# ./hello.c:6:   printf("Hello World
");
# ./hello.c:7:   printf("Hello World
");
# ./hello.c:8:   return 0;
# ./hello.c:9:}
```
每日一题
```
https://github.com/WindrunnerMax/EveryDay
```
参考
```
https://www.runoob.com/linux/linux-comm-grep.html
https://www.tutorialspoint.com/unix_commands/grep.htm
https://www.geeksforgeeks.org/fold-command-in-linux-with-examples/
```
相关阅读:
浙江工业大学校赛小马哥和数列
 浙江工业大学校赛 XiaoWei的战斗力
 浙江工业大学校赛猜猜谁是我
 浙江工业大学校赛竹之书（大数，同余定理）
浙江工业大学校赛画图游戏 BugZhu抽抽抽！！
浙江工业大学校赛画图游戏
 pta 天梯地图（Dijkstra）
Atom打造 c/c++编译环境（忙了一个上午）
HRBUST
CSU 1808 地铁（Dijkstra）
原文地址：https://www.cnblogs.com/WindrunnerMax/p/14142952.html

grep命令

语法

参数

示例

每日一题

参考