作者:萧啊https://www.zhihu.com/questio...
awesome-web-scraping 中文版
本文由 伯乐在线 - LynnShaw 翻译,赖信涛 校稿。未经许可,禁止转载!
英文出处:Gregory Petukhov。欢迎加入翻译组。
这个列表包含与网页抓取和数据处理的Python库
网络
通用
异步
网络爬虫框架
功能齐全的爬虫
其他
HTML/XML解析器
通用
清理
文本处理
用于解析和操作简单文本的库。
BI
CLI
60% |######################################################## |
特定格式文件处理
解析和处理特定文本格式的库。
自然语言处理
处理人类语言问题的库。
机器学习
浏览器自动化与仿真
多重处理
异步
异步网络编程库
队列
云计算
电子邮件
电子邮件解析库
网址和网络地址操作
解析/修改网址和网络地址库。
URL
网络地址
网页内容提取
提取网页内容的库。
HTML页面的文本和元数据
视频
维基
WebSocket
用于WebSocket的库。
DNS解析
计算机视觉
其他Python工具列表