• find文本处理(locate)实例学习记录


    find文本处理(locate)实例学习记录

    (一)按文件名称查找

    按照文件名称查找是 find 最常见的用法,需要注意的是,搜索的文件名必须完全匹配,才能找到对应的文件。

    1. 查找当前目录下所有 go 文件

      find . -name "*.go"

    2. 在 etc 目录下,查找大写字母开头的 txt 文件

     find /etc -name "[A-Z]*.txt" -print

    3. 在当前目录下查找不是 out 开头的 txt 文件

     find . -name "out*" -prune -o -name "*.txt" -print

    4. 在当前目录除 git 子目录外查找 txt 文件

     find . -path "./git" -prune -o -name "*.txt" -print

    5. 找出某个文件的所有硬链接,ls 命令 -i 选项可以查看文件的 inode 号

    ls -i 1.txt
    138956 1.txt
    $ find . -num 138956

    这里补充一个小技巧,搜索文件时使用 -iname 参数可以忽略文件名称大小写

    (二)按文件类型查找

    1. 在当前目录下,查找软连接文件

     find . -type l -print

    2. 在当前目录下,查找 log 结尾的普通文件,f 表示普通文件类型

     find . -type f -name "*.log"

    (三)按文件大小查找

    1. 查找小于 64k 的文件

     find . -size -64k -print

    2. 查找大小超过 200M 的文件

     find . -size +200M -type f -print

    (四)按时间查找

    1. 查找 2 天内被修改过的文件

     find . -mtime -2 -type f -print

    2. 查找 2 天前被更改过的文件,-mtime 表示内容修改时间

     find . -mtime +2 -type f -print

    3. 查找一天内被访问的文件,-atime 表示访问时间

     find . -atime -1 -type f -print

    4. 查找一天内状态被改变的文件,-ctime 表示元数据被变化时间

     find . -ctime -1 -type f -print

    5. 查找比 chopin.txt 新的文件

    $ find . -newer "chopin.txt" -type f -print
    $ find . ! -newer "chopin.txt" -type f -print # 旧


    (五)根据权限查找

    1. 查找当前目录权限为 644 的文件

     find . -type f -perm 644

    2. 查找 etc 目录下至少有一个用户有写权限的文件

     find /etc -type f -perm /222

    3. 查找 etc 目录下所有用户都有执行权限的文件

    find /etc -perm -111 -ls 

    (六)组合条件

    1. 查找当前目录下属于 chopin 用户的普通文件,-a 可以省略

     find . -type f -a -user chopin -print

    2. 查找当前目录下大于 2M 或 2 天前被修过的文件

     find . -size +2M -o -mtime +2 -print

    3. 查找当前目录下不是普通文件

    $ find . -not -type f
    $ find . ! -type f


    4. 查找非空文件

     find . ! -empty

    (七)处理动作

    find 根据上述各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来

    1. -print 默认为打印,可省略


    find . -name "*.log" -print
    find . -name "*.log" # 等价

    2. -ls 以 ls 长文件的格式形式输出

    $ find . -name "*.txt" -ls
    138957      4 -rw-r--r--   1 root     root           16 Jan 24 23:20 ./a.txt
    138959      4 -rw-r--r--   1 root     root          172 Jan 24 13:06 ./T.txt
    138956      4 -rw-r--r--   1 root     root           27 Jan 24 23:28 ./1.txt

    3. -delete 删除查找到的文件

    find . -size +100M -delete 

    4. -exec 将查找到的文件传递给 command 命令。下边例子是将查找到的文件传递给了 ls 命令,同理我们可以传递给任何一个 Linux 命令,功能十分强大,也很灵活。

    $ find . -name "*.txt" -exec ls -lh {} ;
    -rw-r--r-- 1 root root 16 Jan 24 23:20 ./a.txt
    -rw-r--r-- 1 root root 172 Jan 24 13:06 ./T.txt
    -rw-r--r-- 1 root root 27 Jan 24 23:28 ./1.txt

    5. -ok 与 -exec 功能一样,只是操作时会提示用户确认,仅此而已。当然,在生产环境上,我们还是推荐使用 ok

    (八)经典案例

    如果存在一个名称乱码的文件,想要删除它,该怎么办?即使我们复制乱码名称到命令行,很有可能终端不能正确识别。不用担心,下边来展示下 find 是如何优雅的解决问题的。

    $ ls  -i
    138957 a.txt  138959 T.txt  132395 ڹ��.txt

    $ find . -inum 132395 -exec rm {} ;

    命令中,-inum 指定的是文件的 inode 号,它是系统中每个文件对应的唯一编号,find 通过编号找到后,执行删除操作。

    ################################################################################

    find总结:

    find命令格式:

    find path -option [-exec ...]

    ################################################################################

    ####按文件名查找

    • -name:按照文件名称查找,准确匹配;
    • -iname:不区分文件名的大小写;
    • -inode:按照文件 inode 号查找;

    ####按照文件类型查找

    按照文件类型查找,可以使用 -type 选项,具体支持的文件类型如下:

    • f:普通文件
    • d:目录文件
    • l:链接文件
    • s:套接字文件
    • p:管道文件
    • b:块设备文件,比如:磁盘
    • c:字符设备文件,比如:键盘、鼠标、网卡

    ####按照文件从属关系查找

    • -user:以用户名查找
    • -group:以组名查找
    • -uid:以用户 ID 查找
    • -gid:以组 ID 查找
    • -nouser:查找没有属主的文件
    • -nogroup:查找没有属组的文件

    ####按照文件大小查找

    按照文件大小查找功能十分常用,用 -size 选项,选项后边指定大小 1024M,表示大小的格式有如下几种:

    • -5M:查找小于 5M 的文件
    • +5M:查找大于 5M 的文件
    • 5M:查找大小为 5M 的文件

    单位支持的有 c(字节)kMG 等,需要注意的是默认单位并不是字节,而是 b,大小为 512 字节。

    ####按照时间查找

    按照时间查找的功能对系统管理员来说,十分常用,find 支持如下几种时间类型:

    • atime:以访问时间查找
    • mtime:以数据修改时间查找
    • ctime:以元数据修改时间查找
    • newer:以文件为条件,判断比它新的文件

    按时间查找时,使用格式如下:

    • -atime -5:表示 5 天内访问过的文件;
    • -atime +5:表示 6 天前访问过的文件;
    • -atime 5:表示前 5-6 那一天访问的文件;

    find 不仅可以按  为单位来查找文件,可以按照 aminmmincmin 来查找,区别只是 min 选项单位为分钟。

    #######按照权限查找

    按权限查找是通过 -perm 选项,可以按照如下方式使用:

    • -perm 644:精确权限查找
    • -perm /666:任何一类用户中的任何一位符合条件即满足
    • -perm -222:每一类用户的每一位同时符合条件即满足

    组合条件

    find 可以使用多个条件的组合,支持 -a-o-not 或 !,比较简单,不再详细描述其含义。

    处理动作

    find 根据各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来。

    • -print:打印,默认动作,可省略
    • -ls:以 ls 长文件格式输出
    • -delete:删除查找到的文件
    • -exec:查找到的文件传递给任何 Linux 命令
    • -ok:与 exec 功能相同,区别是需要用户确认每次的操作

    虽然 find 功能非常强大,但要知道的是,find 执行过程是通过扫描磁盘文件来进行查找的,如果大范围的查找文件,需要花费的时间很长,且消耗服务器 cpu 资源。

    这里推荐另一个 Linux 文件查找神器 locate,类似于 win 平台下的 everything。它基于索引表进行查询,查询速度非常快,基本不占用 cpu 资源。

    yum install -y mlocate            ######yum安装

    updatedb          #####刷新数据库

    locate  xxx.txt        #####

    蓦然回首,那人却在,灯火阑珊处。
  • 相关阅读:
    Fiddler: Creation of interception certificate failed.
    ip地址检查正则表达式 兼容ipv4,ipv6
    母版页与子页的启动过程
    erlang 读取confg文件异常 could not start kernel pid error in config file
    转义字符 显示形式 转换成 实际形式 \\n to \n
    How to use epoll? A complete example in C
    Lex & Flex 词法分析器实践(未完,持续更新)
    我理解的爱情———柳智宇 (转载)
    Learning by doing 系列文章概述
    锁与RCU数据共享机制
  • 原文地址:https://www.cnblogs.com/linux-186/p/14544585.html
Copyright © 2020-2023  润新知