lsof简介
lsof是英文list open file的简称,作用是列出系统上进程打开的所有文件。在Linux环境下,一切皆文件,任何事物都是以文件的形式
存在的。任何进程在打开文件时,他都会向内核申请一个文件描述符,这个描述符为该进程和操作系统之间的交互提供了通用的接口。因
为应用程序打开文件的描述符,这个描述符提供了关于这个进程本身的大量信息,我们可以通过lsof命令查看这些信息。
lsof命令输出信息解释
我们在终端上输入这个命令可以列出系统打开的所有的文件,由于lsof需要访问核心内存和系统资源,所以为了可以查看所有完整
的信息,我们最好使用root权限执行这个命令。这个命令执行结果如下:
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
init 1 root cwd DIR 3,3 1024 2 /
init 1 root rtd DIR 3,3 1024 2 /
init 1 root txt REG 3,3 38432 1763452 /sbin/init
init 1 root mem REG 3,3 106114 1091620 /lib/libdl-2.6.so
init 1 root mem REG 3,3 7560696 1091614 /lib/libc-2.6.so
init 1 root mem REG 3,3 79460 1091669 /lib/libselinux.so.1
init 1 root mem REG 3,3 223280 1091668 /lib/libsepol.so.1
init 1 root mem REG 3,3 564136 1091607 /lib/ld-2.6.so
init 1 root 10u FIFO 0,15 1309 /dev/initctl
lsof每行显示的是一个打开的文件,如果不接参数,默认是列出所有进程打开的文件,如下:
command:进程的名称
PID:进程的标识符
USER:进程的所有者
FD:文件描述符
TYPE:文件的类型
DEVICE:指定磁盘的名称
SIZE:文件的大小
NODE:索引节点
NAME:打开文件的确切名称
重点了解:
FD:文件描述符
cwd:表示应用程序的当前工作目录。
txt:表示该文件是程序代码,如二进制程序本身或共享库,如上面显示的/sbin/init程序。
10u:数值表示应用程序的文件描述符,这个是打开文件时返回的一个整数。u表示被打开文件处于“读取”和“写入”模式,
®表示只读模式, w表示只写模式,W表示应用程序对整个文件的写锁,表示该文件描述符一次只能被一个应用
程序使用。文件描述符中有3个特殊的值,0、1、2,分别代表标准输入,标准输出和错误输出。所以,其他的文件
描述符一般是从3开始的。
TYPE:文件类型。例如:Unix、REG、DIR、CHR、BLK、FIFO等
lsof常用参数
lsof常用的作用是查找程序打开的文件名称和数目。Linux系统经常会设置进程打开文件的数目,一般是1024,如果有需要可以增加。如果
你怀疑你的进程耗尽了所有的文件描述符,那么你可以使用lsof命令统计一下进程打开的文件数目。
格式:
lsof [options] filename
lsof filename:显示打开指定文件的所有进程
lsof -a:表示两个参数都必须满足时才显示结果
lsof -p PID:查看某个指定PID进程的文件打开情况
lsof -c string:列出COMMAND中包含string字符串的进程打开的所有文件
lsof -u username:列出username用户下的进程打开的所有文件
lsof -g gid:显示归属gid的进程情况
lsof +d /DIR/:显示目录下被进程打开的文件
lsof +D /DIR/:同上,但是会搜索目录下的所有目录,时间相对较长
lsof -d FD:显示指定文件描述符的进程
lsof -n:不将IP转换为hostname,缺省是不加上-n参数
lsof -i:用以显示符合条件的进程情况
示例:
1、查看占用22号端口的那个进程的信息
lsof -i :22
2、imix用户打开的,文件描述符为txt的进程
lsof -a -u imix -d txt
lsof使用场景
1、查找谁在使用文件系统
通常我们在卸载文件系统时,会报磁盘设备忙错误,无法执行成功等。因为当这个文件系统上有文件被打开时,你操作都会失败的
正常的方法是:通过正常手段通知哪些进程释放对该文件系统的占用,然后就可以操作了。由于当有进程占用文件系统时,我们是无法
进行相关操作的。所以,大部分的守护进程(后台进程)和特定的进程,他们都会将工作目录设置为/,以避免上面的问题。
2、恢复删除的文件
文件删除的原理:
普通文件的数据分为:“元数据”和“真实数据”。元数据包括文件的:类型、权限、属主属组、大小、时间和inode与其block的指针。
文件的名称与其inode对应关系存放在父级目录的元数据信息中。所以,我们删除文件时,删除的是文件名与inode的对应关系。
所以在生产环境中,删除内容是非常块的。
LInux系统通过目录的元数据信息,找到其子类容文件名称与其inode的对应关系,根据inode的索引指针获取磁盘上的数据块。
所以删除文件就是要删除这种对应关系。
文件的使用:在linux中文件是怎么被使用的呢?我们通过计数的方式来表现。
链接计数(i_link):当我们创建一个文件时,必须将这个文件的文件名与一个inode关联,这就是一次硬链接。所以,一般文件创建的
时候,链接次数至少是一。
引用计数(i_count):当一个文件被进程占用(占用:包括读取、写入、执行等)时,他的计数就会加1
所以,当我们删除一个文件的时候,就是将这两个计数为0,才能表示这个文件被删除了。
当Linux计算机受到入侵时,常见的情况是日志文件被删除,以掩盖攻击者的踪迹。管理错误也可能导致意外删除重要的文件,比如在清理旧日志时,
意外地删除了数据库的活动事务日志。有时可以通过lsof来恢复这些文件。
当进程打开了某个文件时,只要该进程保持打开该文件,即使将其删除,它依然存在于磁盘中。这意味着,进程并不知道文件已经被删除,它仍然可
以向打开该文件时提供给它的文件描述符进行读取和写入。除了该进程之外,这个文件是不可见的,因为已经删除了其相应的目录索引节点。
在/proc 目录下,其中包含了反映内核和进程树的各种文件。/proc目录挂载的是在内存中所映射的一块区域,所以这些文件和目录并不存在于磁盘中,
因此当我们对这些文件进行读取和写入时,实际上是在从内存中获取相关信息。大多数与 lsof 相关的信息都存储于以进程的 PID 命名的目录中,即
/proc/1234 中包含的是 PID 为 1234 的进程的信息。每个进程目录中存在着各种文件,它们可以使得应用程序简单地了解进程的内存空间、文件描
述符列表、指向磁盘上的文件的符号链接和其他系统信息。lsof 程序使用该信息和其他关于内核内部状态的信息来产生其输出。所以lsof 可以显示进程
的文件描述符和相关的文件名等信息。也就是我们通过访问进程的文件描述符可以找到该文件的相关信息。
当系统中的某个文件被意外地删除了,只要这个时候系统中还有进程正在访问该文件,那么我们就可以通过lsof从/proc目录下恢复该文件的内容。
假如由于误操作将/var/log/messages文件删除掉了,那么这时要将/var/log/messages文件恢复的方法如下:
首先使用lsof来查看当前是否有进程打开/var/logmessages文件,如下:
# lsof |grep /var/log/messages
syslogd 1283 root 2w REG 3,3 5381017 1773647 /var/log/messages (deleted)
从上面的信息可以看到 PID 1283(syslogd)打开文件的文件描述符为 2。同时还可以看到/var/log/messages已经标记被删除了。
因此我们可以在 /proc/1283/fd/2 (fd下的每个以数字命名的文件表示进程对应的文件描述符)中查看相应的信息。
如果可以通过文件描述符查看相应的数据,那么就可以使用 I/O 重定向将其复制到文件中,如:
cat /proc/1283/fd/2 > /var/log/messages