在使用Selenium的过程中,偶然发现浏览器意外关闭导致意料之外的错误发生。比如重复启动浏览器。在无界面headless模式下,因为目前流行的浏览器是多进程的,这是很难发现的。在浑然不知的情况下,多次重复启动浏览器而没有正常关闭,很可能导致多个浏览器进程以“假死”的状态滞留内存。“僵尸”进程占用浪费系统资源,堵塞其他进程,降低系统的性能。因此,需要合理正确的判断且处理浏览器状态,并在必要时回收系统资源的方法。
由于Selenium中webdriver是直接管理浏览器行为的实体,所以可以通过webdriver管理浏览器行为的方法来简单有效地鉴别其状态。比如,webdriver的execute_script(javascript_string)方法。学习过Javascript的码友想必知道,最简单的Javascript代码之一:
javascript:void(0);
它所表达的意义跟空集没什么两样。但是,它的作用却是不容小觑。比如,最流行的是用在<a>标签的href属性,点击使用该方法的<a>标签不跳转和弹出新标签页。进而通过设置对应的Javascript脚本来响应点击事件。
<a href="javascript:void(0);" class="title">...</a>
执行该脚本代码没有实际清晰的意义,它却是完整的一行Javascript脚本代码。如果通过webdriver启动的浏览器没有关闭和出现异常,是可以正常执行该段代码的。否则,浏览器实例出现意料之外的问题。
from selenium import webdriver object_existed = False # driver = webdriver.Firefox() # or driver = webdriver.Chrome() if driver is not None: try: driver.execute_script('javascript:void(0);') object_existed = True except: # webdriver要求浏览器执行Javascript出现异常 try: driver.quit() finally: driver = None finally: pass if not object_existed: # 浏览器已关闭或标签页已关闭或其他异常 ...
笔记:
“javascript:void(0);”看似毫无意义,其实它的存在和数学里的“0”和“空集”是一样的,是不可或缺的。这也验证了计算机科学与数学应用的关联和一致性。