Requests库主要有七个主要的方法:
而我们爬虫一般用的主要是get()方法。其原理主要是:
Response对象包含服务器返回的所有信息,也包含请求的Request信息。其中Response对象主要包含以下属性信息,
requests.request(method, url, **kwargs)
**kwargs : 控制访问的参数,共 13 个,均为可选项。以下为其列举: params : 字典或字节序列,作为参数增加到 url 中 kv = { 'key1' : 'value1' , 'key2' : 'value2' } r = requests . request ( 'GET' , 'http://python123.io/ws' , params = kv ) print(r.url) http://python123.io/ws?key1=value1&key2=value2 data : 字典、字节序列或文件对象,作为 Request 的内容 json : JSON 格式的数据,作为 Request 的内容 headers : 字典, HTTP 定制头 cookies : 字典或 CookieJar , Request 中的 cookie auth : 元组,支持 HTTP 认证功能 files : 字典类型,传输文件 timeout : 设定超时时间,秒为单位 proxies : 字典类型,设定访问代理服务器,可以增加登录认证 allow_redirects : True/False ,默认为 True ,重定向开关 stream : True/False ,默认为 True ,获取内容立即下载开关 verify : True/False ,默认为 True ,认证 SSL 证书开关 cert : 本地 SSL 证书路径 应用: requests.get( url , params=None , **kwargs )或其它提交方法。