Java教程

【金秋打卡】第六天 0基础开发简单爬虫

本文主要是介绍【金秋打卡】第六天 0基础开发简单爬虫,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

学习课程名称:0基础开发简单爬虫
章节名称:爬虫基础
讲师姓名:大壮老师


课程内容:

  1. http 和 Https 基础知识
  2. requests模块入门
  3. requests模块进阶
  4. xpath基础语法
  5. lxml模块

http:就是互联网上应用最广泛的一种网络协议,是客户端和服务端请求和应答的标准设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

简单讲是HTTP的安全版,即HTTP+SSL/TLS,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。

简单来说,HTTPS协议是由SSL/TLS+HTTP协议构建的可进行加密传输、身份认证的网络协议,要比http协议安 全。区别主要如下:

1、https协议需要到ca申请证书,一般免费证书较少,因而需要一定费用。

2、http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。

3、http和https使用的是完全不同的连接方式,用的默认端口也不一样,前者是80,后者是443。

4、http的连接很简单,是无状态的;HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,比http协议安全。

http请求的组成

请求行:请求的第一行是“方法URI协议/版本”。

消息报头:请求头包含许多有关的客户端环境和请求正文的有用信息。

请求正文:请求正 文中可以包含客户提交的查询字符串信息,在实际应用中,HTTP请求正文可以包含更多 的内容。

请求方法:GET、POST、HEAD、PUT、DELETE、TRACE、CONNECT、OPTIONS


图片描述

这篇关于【金秋打卡】第六天 0基础开发简单爬虫的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!