一,multiprocessing模块结束
python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大部分情况需要使用多进程。Python提供了multiprocessing。
multiprocessing模块用来开启子进程,并在子进程中执行我们定制的任务(比如函数),该模块与多线程模块threading的编程接口类似。
multiprocessing模块的功能众多:支持子进程、通信和共享数据、执行不同形式的同步,提供了Process、Queue、Pipe、Lock等组件。
需要再次强调的一点是:与线程不同,进程没有任何共享状态,进程修改的数据,改动仅限于该进程内。
二,Process类的介绍
p=Process(target=task,args=('子进程',))
#由该类实例化得到的对象,表示一个子进程中的任务(尚未启动)
强调:
1,args指定的为传给target函数的位置参数,是一个元祖形式,如果只有一个参数的话,一定记住加逗号。
2.target表示调用对象,即子进程要执行的任务。
3.args表示调用对象的位置参数元祖。
4 . p.start() 只是在向操作系统发送一个开启子进程的信号。
三,创建并开启子进程的两种方式:
方式一:(用默认类的方式)
# from multiprocessing import Process
# import time
#
# def task(x):
# print('%s is running' %x)
# time.sleep(3)
# print('%s is done' %x)
#
# if __name__ == '__main__':
# # Process(target=task,kwargs={'x':'子进程'})
# p=Process(target=task,args=('子进程',)) # 如果args=(),括号内只有一个参数,一定记住加逗号
# p.start() # 只是在操作系统发送一个开启子进程的信号
#
# print('主')
方式二:(自定义类的方式)
# from multiprocessing import Process
# import time
#
# class Myprocess(Process): #自定义类
# def __init__(self,x):
# super().__init__()
# self.name=x
#
# def run(self): #把子进程想执行的任务放到run下面的函数体代码
# print('%s is running' %self.name) #self是p
# time.sleep(3)
# print('%s is done' %self.name)
#
# if __name__ == '__main__':
# p=Myprocess('子进程1')
# p.start() #等于是自动调用 p.run()
# print('主')
补充:
僵尸进程和孤儿进程
一:僵尸进程(有害) 僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。
父进程代码运行完毕后,等待子进程代码运行完进入僵尸状态(保留PID,其他都没了,就叫僵尸状态),最后父进程统一发起回收
子进程僵尸的操作。
二:孤儿进程(无害) 孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
四,进程内存空间彼此隔离
from multiprocessing import Process n=100 #在windows系统中应该把全局变量定义在if __name__ == '__main__'之上就可以了 def work(): global n n=0 print('子进程内: ',n) if __name__ == '__main__': p=Process(target=work) p.start() print('主进程内: ',n)
用以上方法来证明,内存空间是彼此隔离的。
在子进程中用global声明了全局变量,且把n=100改为0,当主进程进行打印的时候,n=100没变,说明内存空间是隔离的。
五,进程对象的方法或属性详解。
join方法
join方法,是父进程在原地等,等到子进程运行完毕后,才执行下一行代码
#1、join
# from multiprocessing import Process
# import time
#
# def task(name):
# print('%s is running ' %name)
# time.sleep(3)
# print('%s is done ' % name)
#
#
# if __name__ == '__main__':
# p=Process(target=task,args=('子进程1',))
# p.start()
# p.join() # 让父进程在原地等待,等到子进程运行完毕后,才执行下一行代码
# print('主')
启动进程与join进程可以简写为:
# from multiprocessing import Process
# import time
#
# def task(name,n):
# print('%s is running ' %name)
# time.sleep(n)
# print('%s is done ' % name)
#
#
# if __name__ == '__main__':
#
# p_l=[]
# start=time.time()
# for i in range(1,4):
# p=Process(target=task,args=('子进程%s' %i,i))
# p_l.append(p)
# p.start()
#
# # print(p_l)
# for p in p_l:
# p.join()
#
# stop=time.time()
#
# print('主',(stop-start))
PID方法:
是进程的ID号
p1子进程是在父进程中造出来的。在父进程中查看子进程的ID,用p1.pid
如果在子进程中看自己的ID,用 os.getpid()
一,父进程内查看子PID的方式:
# pid
# from multiprocessing import Process
# import time
# import os
#
# def task(n):
# print('%s is running ' %os.getpid())
# time.sleep(n)
# print('%s is done ' % os.getpid())
#
#
# if __name__ == '__main__':
# p1=Process(target=task,args=(10,))
# # print(p1.pid)
# p1.start()
# print(p1.pid) # 父进程内查看子pid的方式
# print('主')
二,查看父进程自己的PID(用 os.getppid())
from multiprocessing import Process
import time
import os
def task():
print('自己的id:%s 父进程的id:%s ' %(os.getpid(),os.getppid()))
time.sleep(200)
if __name__ == '__main__':
p1=Process(target=task)
p1.start()
print('主',os.getpid(),os.getppid())
# 爹=》主--》儿子