进程:正在进行的一个过程或者说一个任务,而负责执行任务的则是cpu
(单核+多道,实现多个进程的并发执行)
进程与程序的区别:程序只是一堆代码,进程则是程序的运行过程
并发与并行:
1、并发:是伪并行,看起来同时进行,(单个CPU+多道技术也可以实现,并行属于并发)
奉上一个经典的例子↑
2、并行:同时运行,只有具备多个CPU才可以实现
同步与异步:
同步执行:一个进程在执行某个任务时,另外一个进程必须等待其执行完毕,才能继续执行
异步执行:一个进程在执行某个任务时,另外一个进程无需等待其执行完毕,就可以继续执行,当有消息返回时,系统会通知后者进行处理,这样可以提高执行效率
举个例子,打电话时就是同步通信,发短息时就是异步通信。
小例子
1 from multiprocessing import Process 2 import time,random,os 3 def piao(name): #函数具体实现的功能 4 print(os.getppid(),os.getpid()) #打印父进程与子进程(主进程) 5 print('%s is piaoing'%name) 6 time.sleep(random.randint(1,3)) #睡眠---------产生随机数 7 print('%s is piao end'%name) 8 9 if __name__ == '__main__': 10 p1 = Process(target=piao,kwargs={'name':'alex'}) #实例化 11 p2 = Process(target=piao,kwargs={'name':'egon'}) 12 p1.start() #相当于调用 13 p2.start() 14 print('主进程:',os.getpid()) #当前的进程为子进程View Code
1 from multiprocessing import Process 2 import time,random,os #导入各种模块 3 class Piao(Process): #继承process父类 4 def __init__(self,name): 5 super().__init__() #继承父类 6 self.name = name 7 def run(self): #必须用,每个都需要一个run方法 8 print(os.getppid(),os.getpid()) 9 print('%s is piaoing'%self.name) 10 time.sleep(random.randint(1,3)) #睡一会以便于查看 11 print('%s is piao end '%self.name) 12 13 if __name__ == '__main__': 14 p1 = Piao('alex') 15 p2 = Piao('egon') 16 17 p1.start() 18 p2.start() 19 print('主进程:',os.getpid())View Code
线程:
在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程
线程顾名思义,就是一条流水线工作的过程,一条流水线必须属于一个车间,一个车间的工作过程是一个进程
车间负责把资源整合到一起,是一个资源单位,而一个车间内至少有一个流水线
流水线的工作需要电源,电源就相当于cpu
所以,进程只是用来把资源集中到一起(进程只是一个资源单位,或者说资源集合),而线程才是cpu上的执行单位。
多线程(即多个控制线程)的概念是,在一个进程中存在多个控制线程,多个控制线程共享该进程的地址空间,相当于一个车间内有多条流水线,都共用一个车间的资源。
例如,北京地铁与上海地铁是不同的进程,而北京地铁里的13号线是一个线程,北京地铁所有的线路共享北京地铁所有的资源,比如所有的乘客可以被所有线路拉。
创建进程的开销要远大于线程?
如果我们的软件是一个工厂,该工厂有多条流水线,流水线工作需要电源,电源只有一个即cpu(单核cpu)
一个车间就是一个进程,一个车间至少一条流水线(一个进程至少一个线程)
创建一个进程,就是创建一个车间(申请空间,在该空间内建至少一条流水线)
而建线程,就只是在一个车间内造一条流水线,无需申请空间,所以创建开销小
进程之间是竞争关系,线程之间是协作关系?
车间直接是竞争/抢电源的关系,竞争(不同的进程直接是竞争关系,是不同的程序员写的程序运行的,迅雷抢占其他进程的网速,360把其他进程当做病毒干死)
一个车间的不同流水线式协同工作的关系(同一个进程的线程之间是合作关系,是同一个程序写的程序内开启动,迅雷内的线程是合作关系,不会自己干自己)
为何用多线程:
多线程指的是,在一个进程中开启多个线程,简单的讲:如果多个任务共用一块地址空间,那么必须在一个进程内开启多个线程。详细的讲分为4点:
1. 多线程共享一个进程的地址空间
2. 线程比进程更轻量级,线程比进程更容易创建可撤销,在许多操作系统中,创建一个线程比创建一个进程要快10-100倍,在有大量线程需要动态和快速修改时,这一特性很有用
3. 若多个线程都是cpu密集型的,那么并不能获得性能上的增强,但是如果存在大量的计算和大量的I/O处理,拥有多个线程允许这些活动彼此重叠运行,从而会加快程序执行的速度。
4. 在多cpu系统中,为了最大限度的利用多核,可以开启多个线程(比开进程开销要小的多