Python中进程

Python中进程
程序

程序：编写完的代码称为程序。

进程

进程：又称重量级进程，正在执行中的程序称为进程。进程的执行会占用内存等资源。多个进程同时执行时，每个进程的执行都需要由操作系统按一定的算法（RR调度、优先数调度算法等）分配内存空间。

并行与并发

并行：在多核系统中，每个cpu执行一个进程，可以理解为cpu的数大于进程数，所有进程同时进行。

并发：在操作系统中同时执行多个进程，可以理解为cpu的数小于进程数，有些进程会没有机会执行。

并发与并行的区别：并行指两个或多个程序在同一时刻执行；并发指两个或多个程序在同一时间间隔内发生，可以理解为在表面上看是同时进行，但在同一时刻只有少于程序的总数的程序在执行，计算机利用自己的调度算法让这些程序分时的交叉执行，由于交换的时间非常短暂，宏观上就像是在同时进行一样。

多进程

　　在python中，每一个运行的程序都有一个主进程，可以利用模块中封装的方法来创建子进程。

1、利用os模块中的fork（）来创建子进程
```
import os, time

pid = os.fork()
print("外面的pid",pid)
if pid == 0:
    print("子进程中的程序")
    print("子进程的ｐｉｄ=", os.getpid())
    print("父进程的ｐｉｄ=", os.getppid())

elif pid > 0:
    print("父进程中的程序")
    print("子进程的ｐｉｄ＝", os.getpid())
    print("父进程的ｐｉｄ＝", os.getppid())

else :
    print("创建失败")
```
解释：

os.fork（）：os模块中用来创建子进程的方法，当程序执行到os.fork（）时，操作系统会将当前的进程复制一份，原来的进程称为父进程，新创建的进程称为子进程，两个进程会各自互不干扰的执行下面的程序，父进程与子进程的执行顺序与系统调度有关。父进程与子进程都会在os.fork（）中得到一个返回值，子进程的返回值为0，父进程的返回值为子进程的进程号，这个值永远大于零，具体数值由操作系统分配，如果返回值为负数则表明创建子进程失败。

os.getpid（）:获取进程的进程号。

os.getppid（）：获取父进程的进程号。

注意：这个os.fork()方法只有在unix系统中才会有，在window下没有。

2、利用multiprocessing模块Process类创建进程

在multiprocessing模块中提供一个Process（）类来创建进程，直接上代码：
```
from multiprocessing import Process
import time

def test(a):
    for i in range(a):
        print("子进程...")
        time.sleep(1)


p = Process(target=test,args=(5,))
p.start()
p.join(2)
while True:
    print("父进程...")
    time.sleep(1)
```
解释：

这里的p相当于Process类的一个实例对象，每实例化一个对象就是创建一个子进程。

target = test ：子进程所执行的任务，就是test这个函数

args = (5,) :给进程函数传参，这里需要用元祖的方式进行传参

p.start（）：执行子进程，只用调用start（）方法，子进才会执行

p.join(n) ：让主进程等待n秒钟

在进程结束后，主进程会等待子进程先结束，如果主进程先结束，那么所有的子进程都会结束。

Process常用的方法：

start（）：启动进程

is_alive() ：判断进程是否还在执行，返回True 或 False

join(n) : 主进程等待子进程，n为等待的时间（秒）

run() :在调用start方法时会自动调用run()方法，可以创建Process类的子类来重写run()方法的方式创建进程

terminate（）：使进程立即终止

3、利用Process类的子类来创建进程
```
from multiprocessing import Process
import time

class NewProcess(Process):
    def __init__(self,num):
        self.num = num
        super().__init__()

    def run(self):
        print("开始重写run了")
        i = 0
        while True:
            time.sleep(1)
            i += 1
            print("子进程",i)
            if i == self.num:
                break

p = NewProcess(6)
p.start()
p.join(2)
while True:
    if p.is_alive():
        print("父进程")
        time.sleep(1)
    elif not p.is_alive():
        print("子进程结束了")
        break
```
这个方法核心就是创建一个Process类的子类，利用重写run（）方法来实现任务的添加。

4、利用multiprocessing模块进程池Pool创建进程

Process类适合用于创建所需进程数量不多的情况，如果需要创建大量的进程，则需要利用进程池来创建进程。
```
from multiprocessing import Pool
import time
import os

def work(i):
    time.sleep(1)
    print(i,"当前程序的pid=",os.getpid())
def work1(i):
    time.sleep(1)
    print(i,"当前程序的pid=",os.getpid())

def work2(i):
    time.sleep(1)
    print(i,"当前程序的pid=",os.getpid())
# 创建进程池
pool = Pool(2)
# 使进程开始执行
pool.apply_async(work,(1,))
pool.apply_async(work1,(2,))
pool.apply_async(work2,(3,))
pool.apply(work1,(4,))
pool.apply(work2,(5,))
pool.apply(work1,(6,))
pool.apply(work2,(7,))
# 关闭进程池
pool.close()
# 让主进程等待子进程
pool.join()
```
解释：

pool = Pool（2）为创建一个进程池，进程池中同时开两个进程，如果任务多于进程数时,进程会逐个执行任务，当一个进程完成任务后，接着执行待完成的任务，直到所有任务全部完成。

pool.apply_async(func,args) :非堵塞式，异步执行。func调用的为任务，args：为func传参，参数以元祖的方式传递。

pool.apply(func,args) ：堵塞式执行。进程会等待上一个进程结束才会进行。传参同上。

pool.close() ：关闭进程池，停止向进程池中添加任务

pool.join() ：使主进程等待。必须在close（）或者terninate（）后面使用。
相关阅读:
部署第二个master节点
 Spark On YARN使用时上传jar包过多导致磁盘空间不够。。。
Spark1.3使用外部数据源时条件过滤只要是字符串类型的值均报错
 spark1.3编译过程中遇到的一个坑
 Hive On Spark hiveserver2方式使用
 Hive On Spark概述
 Hive On Spark环境搭建
 RDD常用方法之subtract&intersection&cartesian
SparkSQL DataFrames操作
 通过Spark SQL关联查询两个HDFS上的文件操作
原文地址：https://www.cnblogs.com/Frange/p/7695970.html

最新文章
计算几何题目
 KMP算法
 并查集题目
 设计题目
 队列实现
 字符串题目
 int()函数
 博弈型动态规划
 go 优秀文档
 正则表达式在线测试工具

程序

进程

并行与并发

多进程

1、利用os模块中的fork（）来创建子进程

2、利用multiprocessing模块Process类创建进程

3、利用Process类的子类来创建进程

4、利用multiprocessing模块进程池Pool创建进程