Python 调用系统命令的模块 Subprocess

Python 调用系统命令的模块 Subprocess
Python 调用系统命令的模块 Subprocess

有些时候需要调用系统内部的一些命令，或者给某个应用命令传不定参数时可以使用该模块。

初识 Subprocess 模块

Subprocess 模块提供了多个方法来运行额外的进程。在 Python2.7 的时候使用的方法主要有 call(),check_call(), check_output(),到了 Python3.5 的时候加入了一个更高级的方法 run()，该方法可以运行一个额外的进程同时它还能收集到运行之后的结果。Popen 类最为一个低级 API，它主要用于构建其他 API，在更复杂的流程交互中非常有用。Popen 的构造函数接受参数来设置新进程，以便父进程可以通过管道与它通信。它替换了其他模块和函数的所有功能，甚至更多。Subprocess 子进程模块旨在替换 os.system(), os.spawnv()等函数，os 和 popen2 模块中 popen()的变体，以及 commands()模块
注意:在 Unix 和 Windows 系统上工作的应用编程接口大致相同，但是底层的实现是不同的，因为操作系统中的过程模型不同。这里显示的所有示例都是在 Mac 操作系统上测试的。在非 Unix 操作系统上的行为可能会有所不同。例如 unix 系统查看文件列表使用 ls,windows 只能使用 dir.

Run 方法使用

运行外部命令

要实现和 os.system()命令相同的方式,运行外部命令而不与之交互时候，我们可以使用 run()函数。前面提到了这是一个高级函数
先看一下其语法结构。
```
subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, capture_output=False, shell=False, cwd=None, timeout=None, check=False, encoding=None, errors=None, text=None, env=None, universal_newlines=None)
```
运行被 arg 描述的指令。等待指令完成，然后返回一个 CompletedProcess 示例。run 方法的参数和 Popen 的构造函数一样，接受的大多数参数都被传递给该接口。（timeout, input, check 和 capture_output 除外）。
```
import subprocess
completed = subprocess.run(['ls', '-1'])
print('returncode:', completed.returncode)
```
输出内容:
```
subprocess_demo.py
returncode: 0
```
第一个参数传入的就是我们要运行的命令,其格式推荐使用列表字符串的形式，将命令进行分割。这避免了转义引号或 shell 可能解释的其他特殊字符的需要。
如果将 shell 参数设置为 true 值将导致子进程生成一个中间 shell 进程，然后运行该命令。默认情况下是直接运行命令。
```
import subprocess

completed = subprocess.run('echo $HOME', shell=True)
print('returncode:', completed.returncode)
```
输出
```
/Users/chenxiangan
returncode: 0
```
使用中间 shell 意味着在运行命令之前要处理命令字符串中的变量、glob 模式和其他特殊的 shell 特性。

错误处理

CompletedProcess 的 returncode 属性是程序的退出代码。调用者负责解释它以检测错误。如果 run()的 check 参数为 True，则检查退出代码，如果它指示发生错误，则引发 CalledProcessError 异常。
```
#公众号:python 学习开发
#author:陈祥安
import subprocess

try:
    subprocess.run(['false'], check=True)
except subprocess.CalledProcessError as err:
    print('ERROR:', err)
```
运行结果
```
ERROR: Command '['false']' returned non-zero exit status 1.
```
false 命令总是以非零状态代码退出，run()将其解释为错误。
将 run()函数的 check 属性设置为 True,等同于使用 check_call()方法。

获取结果

由于 run()启动的进程的标准输入和输出通道绑定到父输入和输出。这意味着调用程序无法捕获命令的输出。可以通过调整 stdout 和 stderr 参数来捕获输出的值。
```
#公众号:python 学习开发
#author:陈祥安
import subprocess

completed = subprocess.run(
    ['ls', '-1'],
    stdout=subprocess.PIPE,
)
print('returncode:', completed.returncode)
print(f"结果的字节长度 {len(completed.stdout)}:
{ completed.stdout.decode('utf-8')}")
```
输出
```
returncode: 0
结果的字节长度 24:
subprocess_demo.py
```
ls -1 命令成功运行，捕获并返回输出结果。
下一个示例在子 shell 中运行一系列命令。在命令退出并显示错误代码之前，消息将发送到标准输出和标准错误。
```
#公众号:python 学习开发

import subprocess

try:
    completed = subprocess.run(
        'echo to stdout; echo to stderr 1>&2; exit 1',
        check=True,
        shell=True,
        stdout=subprocess.PIPE,
    )
except subprocess.CalledProcessError as err:
    print('ERROR:', err)
else:
    print('returncode:', completed.returncode)
    print(f"stdout 中的字节长度 {len(completed.stdout)} : {completed.stdout.decode('utf-8')!r}")
```
输出结果
```
to stderr
ERROR: Command 'echo to stdout; echo to stderr 1>&2; exit 1' returned non-zero exit status 1.
```
发送到标准错误的消息被打印到控制台，但是发送到标准输出的消息是隐藏的。
为了防止通过 run()运行的命令的错误消息被写入控制台，需要将 stderr 参数设置为 subprocess.PIPE。修改后代码如下
```
#公众号:python 学习开发

import subprocess

try:
    completed = subprocess.run(
        'echo to stdout; echo to stderr 1>&2; exit 1',
        shell=True,
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE,
    )
except subprocess.CalledProcessError as err:
    print('ERROR:', err)
else:
    print('returncode:', completed.returncode)
    print(f"stderr 字节长度{len(completed.stdout)}: {completed.stdout.decode('utf-8')!r}")
    print(f"stderr 字节长度{len(completed.stderr)}: {completed.stderr.decode('utf-8')!r}")
```
输出结果
```
returncode: 1
stderr 字节长度 10: 'to stdout
'
stderr 字节长度 10: 'to stderr
'
```
本示例未设置 check=True，因此会捕获并打印命令的输出。若要在使用 check_output()时捕获错误消息，请将 stderr 设置为 STDOUT，消息将与命令的其余输出合并。

禁止输出

对于不应该显示或捕获输出的情况，使用 DEVNULL 来抑制输出流，这个例子同时抑制了标准输出和错误流。
```
# 公众号:python 学习开发


import subprocess

try:
    completed = subprocess.run(
        'echo to stdout; echo to stderr 1>&2; exit 1',
        shell=True,
        stdout=subprocess.DEVNULL,
        stderr=subprocess.DEVNULL,
    )
except subprocess.CalledProcessError as err:
    print('ERROR:', err)
else:
    print('returncode:', completed.returncode)
    print(f'stdout is {completed.stdout!r}')
    print(f'stderr is {completed.stderr!r}')
```
输出
```
returncode: 1
stdout is None
stderr is None
```
名称 DEVNULL 来自于 Unix 特殊设备文件/DEVE/null，该文件在打开读取时以文件结尾响应，并在写入时接收但忽略任何数量的输入。

Popen 方法的使用

函数 run()、call()、check_call()和 check_output()是 Popen 类的包装器。直接使用 Popen 可以更好地控制命令的运行方式以及输入和输出流的处理方式。例如，通过传递 stdin、stdout 和 stderr 的不同参数，可以模拟 os.popen()。
Popen 的语法结构如下:
```
class subprocess.Popen(args, bufsize=-1, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, close_fds=True, shell=False, cwd=None, env=None, universal_newlines=None, startupinfo=None, creationflags=0, restore_signals=True, start_new_session=False, pass_fds=(), *, encoding=None, errors=None, text=None)¶
```
args 应当是一个程序的参数列表或者一个简单的字符串。默认情况下，如果 args 是一个序列，将运行的程序是此序列的第一项。如果 args 是一个字符串，解释是平台相关的，如下所述。除非另有说明，推荐将 args 作为序列传递。
参数 shell （默认为 False）指定是否使用 shell 执行程序。如果 shell 为 True，更推荐将 args 作为字符串传递而非序列。
在 POSIX，当 shell=True， shell 默认为 /bin/sh。如果 args 是一个字符串，此字符串指定将通过 shell 执行的命令。这意味着字符串的格式必须和在命令提示符中所输入的完全相同。这包括，例如，引号和反斜杠转义包含空格的文件名。如果 args 是一个序列，第一项指定了命令，另外的项目将作为传递给 shell （而非命令）的参数对待。也就是说， Popen 等同于:
```
Popen(['/bin/sh', '-c', args[0], args[1], ...])
```
在 Windows，使用 shell=True，环境变量 COMSPEC 指定了默认 shell。在 Windows 你唯一需要指定 shell=True 的情况是你想要执行内置在 shell 中的命令（例如 dir 或者 copy）。在运行一个批处理文件或者基于控制台的可执行文件时，不需要 shell=True。

与进程的单向通信

要运行进程并读取其所有输出，需要将 stdout 值设置为 PIPE 并调用。
```
import subprocess

print('read:')
proc = subprocess.Popen(
    ['echo', '"to stdout"'],
    stdout=subprocess.PIPE,
)
stdout_value = proc.communicate()[0].decode('utf-8')
print('stdout:', repr(stdout_value))
```
输出
```
read:
stdout: '"to stdout"
'
```
如果要设置管道允许调用程序将数据写入管道，需要将 stdin 设置为 pipe。
```
import subprocess

print('write:')
proc = subprocess.Popen(
    ['cat', '-'],
    stdin=subprocess.PIPE,
)
proc.communicate('stdin: to stdin
'.encode('utf-8'))
```
输出
```
write:
stdin: to stdin
```
要一次将数据发送到进程的标准输入通道，可以使用返回对象的 communication()方法。它与使用'w'模式的 popen()类似.

与进程的双向通信

要同时设置 Popen 实例进行读写，请结合使用以前的技术。
```
import subprocess

print('popen2:')

proc = subprocess.Popen(
    ['ls', '-l'],
    stdin=subprocess.PIPE,
    stdout=subprocess.PIPE,
)
msg = 'through stdin to stdout'.encode('utf-8')
stdout_value = proc.communicate(msg)[0].decode('utf-8')
print('pass through:', repr(stdout_value))
```
输出
```
popen2:
pass through: 'total 8
-rw-r--r--  1 chenxiangan  staff  316 Jul  9 11:20 subprocess_demo.py
'
```
使用 communicate() 而非 .stdin.write， .stdout.read 或者 .stderr.read 来避免由于任意其他 OS 管道缓冲区被子进程填满阻塞而导致的死锁。

错误捕获

Popen 还可以像使用 popen3()一样,同时监视 stdout 和 stderr 流。
```
import subprocess

print('popen3:')
proc = subprocess.Popen(
    'ls -l; echo "to stderr" 1>&2',
    shell=True,
    stdin=subprocess.PIPE,
    stdout=subprocess.PIPE,
    stderr=subprocess.PIPE,
)
msg = 'through stdin to stdout'.encode('utf-8')
stdout_value, stderr_value = proc.communicate(msg)
print('pass through:', repr(stdout_value.decode('utf-8')))
print('stderr      :', repr(stderr_value.decode('utf-8')))
```
输出
```
popen3:
pass through: 'total 8
-rw-r--r--  1 chenxiangan  staff  447 Jul  9 11:22 subprocess_os_system.py
'
stderr      : 'to stderr
'
```
从 stderr 读取的工作与 stdout 相同。通过传入 PIPE 告诉 Popen 连接到通道，并且 communication()方法在返回结果之前可以从中读取所有数据。

结合常规输出和错误输出

要将进程的错误输出定向到其标准输出通道，可以使用 STDOUT 代替 stderr 而不是 PIPE。
```
# 公众号:python 学习开发


import subprocess

print('popen4:')
proc = subprocess.Popen(
    'ls -l; echo "to stderr" 1>&2',
    shell=True,
    stdin=subprocess.PIPE,
    stdout=subprocess.PIPE,
    stderr=subprocess.STDOUT,
)
msg = 'through stdin to stdout
'.encode('utf-8')
stdout_value, stderr_value = proc.communicate(msg)
print('combined output:', repr(stdout_value.decode('utf-8')))
print('stderr value   :', repr(stderr_value))
```
输出
```
popen4:
combined output: 'total 8
-rw-r--r--  1 chenxiangan  staff  441 Jul  9 11:25 subprocess_os_system.py
to stderr
'
stderr value   : None
```
以这种方式组合输出类似于 popen4()的工作方式。

管道之间的连接

通过创建单独的 Popen 实例并将它们的输入和输出链接在一起，可以类似于 Unix shell 的工作方式将多个命令连接到管道中。
```
# 公众号:python 学习开发


import subprocess

cat = subprocess.Popen(
    ['cat', 'subprocess_demo.py'],
    stdout=subprocess.PIPE,  # 提供输出的方式
)

grep = subprocess.Popen(
    ['grep', '公众号'],
    stdin=cat.stdout,  # cat 的输出最为输入
    stdout=subprocess.PIPE,
)

cut = subprocess.Popen(
    ['awk', '-F', ':', '{print $2}'],
    stdin=grep.stdout,
    stdout=subprocess.PIPE,
)

end_of_pipe = cut.stdout

print(end_of_pipe.readline().decode('utf-8'))
```
输出
```
python 学习开发
```
上面的内容就等价于下面的命令
```
cat subprocess_demo.py |grep "公众号" |awk -F ':' '{print $2}'
```
与另一个命令交互

前面的所有示例都假定了有限的交互量。方法读取所有输出并等待子进程退出后返回。在程序运行时，还可以增量地对 Popen 实例使用的各个管道句柄进行读写。一个简单的 echo 程序演示了这种技术，该程序从标准输入读取数据并将其写入标准输出。
在下一个示例中，脚本 repeat.py 用作子进程。它从 stdin 读取值并将值写入 stdout，每次一行，直到没有更多输入为止。它还在启动和停止时向 stderr 写入一条消息，显示子进程的生存期。
```
# 文件:repeater.py
# 公众号:python 学习开发
import sys

sys.stderr.write('repeater.py: starting
')
sys.stderr.flush()

while True:
    next_line = sys.stdin.readline()
    sys.stderr.flush()
    if not next_line:
        break
    sys.stdout.write(next_line)
    sys.stdout.flush()

sys.stderr.write('repeater.py: exiting
')
sys.stderr.flush()
```
下一个交互示例以不同的方式使用 Popen 实例拥有的 stdin 和 stdout 文件句柄.
在第一个例子中，将 0-4 依次被写入进程的 stdin，并且在每次写入之后读回下一行输出。在第二个示例中，写入这五个数字，但是使用 communic()一次读取所有输出。
```
import io
import subprocess

print('One line at a time:')
proc = subprocess.Popen(
    'python3 repeater.py',
    shell=True,
    stdin=subprocess.PIPE,
    stdout=subprocess.PIPE,
)
stdin = io.TextIOWrapper(
    proc.stdin,
    encoding='utf-8',
    line_buffering=True,  # send data on newline
)
stdout = io.TextIOWrapper(
    proc.stdout,
    encoding='utf-8',
)
for i in range(5):
    line = '{}
'.format(i)
    stdin.write(line)
    output = stdout.readline()
    print(output.rstrip())
remainder = proc.communicate()[0].decode('utf-8')
print(remainder)

print()
print('All output at once:')
proc = subprocess.Popen(
    'python3 repeater.py',
    shell=True,
    stdin=subprocess.PIPE,
    stdout=subprocess.PIPE,
)
stdin = io.TextIOWrapper(
    proc.stdin,
    encoding='utf-8',
)
for i in range(5):
    line = f'{i}
'
    stdin.write(line)
stdin.flush()

output = proc.communicate()[0].decode('utf-8')
print(output)
```
“repeater.py：exiting”出现在每个循环位置的不同点。
```
One line at a time:
repeater.py: starting
0
1
2
3
4
repeater.py: exiting


All output at once:
repeater.py: starting
repeater.py: exiting
0
1
2
3
4
```
信号之间的进程

正在 os 模块中的进程管理示例包括使用 os.fork()和 os.kill()在进程之间发送信号的演示。
由于每个 Popen 实例都提供了一个带有子进程的进程 id 的 pid 属性，所以可以对子进程执行类似的操作。下一个例子结合了两个脚本。这个子进程为 USR 信号设置一个信号处理器。
```
#signal_child.py
import os
import signal
import time
import sys

pid = os.getpid()
received = False


def signal_usr1(signum, frame):
    "Callback invoked when a signal is received"
    global received
    received = True
    print(f'CHILD {pid:>6}: Received USR1')
    sys.stdout.flush()


print(f'CHILD {pid:>6}: Setting up signal handler')
sys.stdout.flush()
signal.signal(signal.SIGUSR1, signal_usr1)
print(f'CHILD {pid:>6}: Pausing to wait for signal')
sys.stdout.flush()
time.sleep(3)

if not received:
    print(f'CHILD {pid:>6}: Never received signal')
```
然后再写一个文件,此脚本作为父进程运行。它启动 signal_child.py，然后发送 USR1 信号。
```
import os
import signal
import subprocess
import time
import sys

proc = subprocess.Popen(['python3', 'signal_child.py'])
print('PARENT      : Pausing before sending signal...')
sys.stdout.flush()
time.sleep(1)
print('PARENT      : Signaling child')
sys.stdout.flush()
os.kill(proc.pid, signal.SIGUSR1)
```
运行之后
```
PARENT      : Pausing before sending signal...
CHILD  46573: Setting up signal handler
CHILD  46573: Pausing to wait for signal
PARENT      : Signaling child
CHILD  46573: Received USR1
```
进程组

如果子进程是由 Popen 创建的进程产生的，那些子进程将不会收到发送给父进程的任何信号。当 Popen 使用 shell 参数时，很难通过发送 SIGINT 或 SIGTERM 来使 shell 中启动的命令终止。
若要在不知道进程 id 的情况下向后代发送信号，请使用进程组将子进程关联起来，以便将它们一起发送信号。使用 os.setpgrp()创建进程组,将进程组 id 设置为当前进程的进程 id。
```
import os
import signal
import subprocess
import tempfile
import time
import sys

script = '''#!/bin/sh
echo "Shell script in process $$"
set -x
python3 signal_child.py
'''
script_file = tempfile.NamedTemporaryFile('wt')
script_file.write(script)
script_file.flush()

proc = subprocess.Popen(['sh', script_file.name])
print('PARENT      : Pausing before signaling {}...'.format(
    proc.pid))
sys.stdout.flush()
time.sleep(1)
print('PARENT      : Signaling child {}'.format(proc.pid))
sys.stdout.flush()
os.kill(proc.pid, signal.SIGUSR1)
time.sleep(3)
```
输出
```
PARENT      : Pausing before signaling 46600...
Shell script in process 46600
+ python3 signal_child.py
CHILD  46601: Setting up signal handler
CHILD  46601: Pausing to wait for signal
PARENT      : Signaling child 46600
CHILD  46601: Never received signal
```
用于发送信号的 pid 与等待信号的 shell 脚本的子脚本的 pid 不匹配，因为在本例中有三个独立的进程在交互
1.程序子进程向父 shell.py 发送信号
2.shell 进程运行主 python 程序创建的脚本
3.signal_child.py 进程。
如果想在不知道其进程 ID 的情况下向后代发送信号，可以使用进程组来关联子进程，以便它们可以一起发出信号。可以使用 os.setpgrp()创建进程组，然后将进程组 id 设置为当前进程的进程 id。这样所有子进程都从父进程继承它们的进程组,因为它只能在 Popen 及其后代创建的 shell 中设置，所以不应该在创建 Popen 的同一进程中调用 os.setpgrp()。更改之后的代码如下:
```
import os
import signal
import subprocess
import tempfile
import time
import sys


def show_setting_prgrp():
    print('Calling os.setpgrp() from {}'.format(os.getpid()))
    os.setpgrp()
    print('Process group is now {}'.format(os.getpgrp()))
    sys.stdout.flush()


script = '''#!/bin/sh
echo "Shell script in process $$"
set -x
python3 signal_child.py
'''
script_file = tempfile.NamedTemporaryFile('wt')
script_file.write(script)
script_file.flush()

proc = subprocess.Popen(
    ['sh', script_file.name],
    preexec_fn=show_setting_prgrp,
)
print('PARENT      : Pausing before signaling {}...'.format(
    proc.pid))
sys.stdout.flush()
time.sleep(1)
print('PARENT      : Signaling process group {}'.format(
    proc.pid))
sys.stdout.flush()
os.killpg(proc.pid, signal.SIGUSR1)
time.sleep(3)
```
输出结果
```
+ python3 signal_child.py
Calling os.setpgrp() from 46618
Process group is now 46618
PARENT      : Pausing before signaling 46618...
Shell script in process 46618
CHILD  46619: Setting up signal handler
CHILD  46619: Pausing to wait for signal
PARENT      : Signaling process group 46618
CHILD  46619: Received USR1
```
事件发生的顺序如下:
1.父程序实例化 Popen。
2.Popen 实例派生了一个新的进程。
3.新进程运行 os.setpgrp()。
4.新进程会运行 exec()启动 shell。
5.shell 会运行 shell 脚本
6.shell 脚本再次 fork，该进程执行 Python。
7.python 运行脚本 signal_child.py
8.父程序使用 shell 的 pid 向进程组发出信号。
9.shell 和 Python 进程接收信号
10.运行 signal child.py 的 Python 进程调用信号处理程序。

参考资料

https://docs.python.org/3.7/library/subprocess.html
相关阅读:
JAVA字符串格式化-String.format()的使用
 分布式文件系统MFS(moosefs)实现存储共享(第二版)
iOS 动画学习
 复制对象（一）copy和mutableCopy方法
 iOS－获取当前网页的 url 和 title 和 html
排序算法 c实现
 常用正则表达式
 iOS－获取的NSDate date时间与实际相差8个小时解决方案
 网络爬虫基本原理(二)
网络爬虫基本原理(一)
原文地址：https://www.cnblogs.com/c-x-a/p/11156325.html

Python 调用系统命令的模块 Subprocess

Python 调用系统命令的模块 Subprocess

初识 Subprocess 模块

Run 方法使用

运行外部命令

错误处理

获取结果

禁止输出

Popen 方法的使用

与进程的单向通信

与进程的双向通信

错误捕获

结合常规输出和错误输出

管道之间的连接

与另一个命令交互

信号之间的进程

进程组

参考资料