python爬虫学习（六）：xpath解析 - 为之网

Python教程

python爬虫学习（六）：xpath解析

本文主要是介绍python爬虫学习（六）：xpath解析，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

xpath解析原理：
- 1.实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中。
- 2.调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获。
- 环境的安装：
  - pip install lxml
- 如何实例化一个etree对象:from lxml import etree
  - 1.将本地的html文档中的源码数据加载到etree对象中：
    etree.parse(filePath)
  - 2.可以将从互联网上获取的源码数据加载到该对象中
    etree.HTML('page_text')
  - xpath('xpath表达式')
- xpath表达式:
  - /:表示的是从根节点开始定位。表示的是一个层级。
  - //:表示的是多个层级。可以表示从任意位置开始定位。
  - 属性定位：//div[@class='song'] tag[@attrName="attrValue"]
  - 索引定位：//div[@class="song"]/p[3] 索引是从1开始的。
  - 取文本：
    - /text() 获取的是标签中直系的文本内容
    - //text() 标签中非直系的文本内容（所有的文本内容）
  - 取属性：
    /@attrName ==>img/src

这篇关于python爬虫学习（六）：xpath解析的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯