第一步
服务器是交战的战场,我们的AI大脑想要参战,先得找到去战场的路。
写程序从以下网址取得下一步的指示
http://2**.207.12.156:9012/step_01
import requests as re gethtml = re.get('http://2**.207.12.156:9012/step_01') print(getHtml.text) >>> {"is_success": true, "message": "Please visit http://2**.207.12.156:9012/context/86e0caa3527526e88c3300ff4c2c3d6e"} >>>
人生苦短我用Python
我们程序大师,天地万物,施代码以蔽之。
你要时刻记住一句话,程序是万能的
区区访问一个网页有什么不可能的?但是访问网页也需要编写代码来完成操作,你不会?
Python大佬们已经帮你写好了,我们只需要调用一下即可。
怎么调用呢import requests as re
调用 requests
包,并且起一个别名re
。
这是写网络爬虫必备的一个第三方类库。Python是网络爬虫的主要制造者,所以.....
什么12306的抢票爬虫里也会有这么一行代码。
有的人可能会用urllib
这个第三方类库。但这已经是老一套了。
requests
包是最新版本,也最好用。
通过get方法访问对应网址,并返回一个相应的类对象。我们只要知道下面这几个就行了。
操作 | 效果 |
---|---|
getHtml.text | 对应网页所应答的内容,文本化 |
getHtml.json() | 若网页返回的是一个JSON数据,可以利用这个将他变成Python的数据类型。若不是则报错。 |
文章会随时改动,注意到博客里去看。一些网站会爬取本文章,但是可能会有出入。
https://www.cnblogs.com/asmurmur/