如果只是想简单地对整个程序做计算统计,通常使用UNIX下的time
命令就足够了。
(base) ➜ Learn-Python time python someprogram.py python someprogram.py 0.10s user 0.01s system 98% cpu 0.117 total
由于我用的是Mac系统,和Linux系统的输出可能有不同,不过关键都是这三个时间:
user: 运行用户态代码所花费的时间,也即CPU实际用于执行该进程的时间,其他进程和进程阻塞的时间不计入此数字。
system: 在内核中执行系统调用(如I/O调用)所花费的CPU时间。
total(Linux下应该是real):即挂钟时间(wall-clock time),也称响应时间(response time)、消逝时间(elapsed time),是进程运行开始到结束所有经过的时间,包括了进程使用的时间片和进程阻塞的时间(例如等待I/O完成)。
请注意,若user + system > total,可能存在多个处理器并行工作;
若user + system < total,则可能在等待磁盘、网络或其它设备的响应。
也就说上面这个程序的挂钟时间为0.251s,CPU实际用于执行该进程的时间为0.24s,用于系统调用的时间为0.01s。
再来看看另外一个极端,如果想针对程序的行为产生一份详细的报告,那么可以使用cProfile
模块:
(base) ➜ Learn-Python python -m cProfile someprogram.py function calls in 0.071 seconds Ordered by: standard name ncalls tottime percall cumtime percall filename:lineno(function) 0.002 0.002 0.071 0.071 someprogram.py:1(<module>) 0.039 0.039 0.068 0.068 someprogram.py:1(func1) 0.029 0.029 0.029 0.029 someprogram.py:3(<listcomp>) 0.000 0.000 0.001 0.001 someprogram.py:7(func2) 0.000 0.000 0.000 0.000 someprogram.py:9(<listcomp>) 0.000 0.000 0.071 0.071 {built-in method builtins.exec} 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}
可见我们上述代码的热点是在于func1
函数。
这里再多说几句,这里传入的-m -cProfile
可选参数意为将Python的cPofile
模块做为脚本运行,实际上等价于:
python /Users/orion-orion/miniforge3/lib/python3.9/cProfile.py someprogram.py
当然,中间那个路径取决于大家各自的环境。这也就是说我们将some_program.py
做为cProfile.py
程序的输入参数,目的就是对其进行性能分析。
不过对于做代码性能分析而言,更常见的情况则处于上述两个极端情况之间。
比如,我们可能已经知道了代码把大部分运行时间都花在几个某几个函数上了。要对函数进行性能分析,使用装饰器就能办到。示例如下:
import time from functools import wraps def timethis(func): @wraps(func) def wrapper(*args, **kwargs): start = time.perf_counter() r = func(*args, **kwargs) end = time.perf_counter() print("{}.{} : {}".format(func.__module__, func.__name__, end - start)) return r return wrapper
要使用这个装饰器,只要简单地将其放在函数定义之前,就能得到对应函数的计时信息了。示例如下:
@timethis def countdown(n): while n > 0: n -= 1 countdown(10000000)
控制台打印输出:
__main__.countdown : 0.574160792
请注意,在进行性能统计时,任何得到的结果都是近似值。我们这里使用的函数time.perf_counter()
是能够提供给定平台上精度最高的计时器,它返回一个秒级的时间值。但是,它计算的仍然是挂钟时间(墙上时间),这会受到许多不同因素的影响(例如机器当前的负载),且它会将程序等待中断的sleep(休眠)时间也计算在内。
标签:Python,性能分析,Linux系统,代码,system,函数, 来源:
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。