bs4解析 - 为之网

Java教程

bs4解析

本文主要是介绍bs4解析，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

数据解析的原理：

标签定位
提取标签、标签属性中存储的数据值

bs4数据解析的原理：

实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中
通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取

如何实例化BeautifulSoup对象:

from bs4 import BeautifulSoup
对象的实例化：
- 将本地的HTML文档中的数据加载到该对象中
- 将互联网上获取的页面源码加载到该对象中
提供的用于数据解析的方法和属性：
- soup.tagName:返回的是文档中第一次出现的tagName对应的标签
- soup.find():
  - find(‘tagName’):等同于soup.tagName
  - 属性定位：find(‘tagName’,class_/id/attr=’’)
- soup.find_all(‘tagName’)：返回符合要求的所有标签（列表）
- select：
  - select(‘某种选择器（id、class、标签……）’)，返回的是一个列表
  - 层级选择器：
    - 表示的是一个层级
    - 空格表示的是多个层级
获取标签之间的文本数据：soup.tagName.text/string/get_text()
- text/get_text():可以获取某一个标签中所有的文本内容
- string:只可以获取该标签下直系的文本内容
获取标签中属性值：soup.tagName[‘属性’]

这篇关于bs4解析的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯