Python教程

Python网络爬虫笔记12：Scrapy进阶之数据建模与翻页

本文主要是介绍Python网络爬虫笔记12：Scrapy进阶之数据建模与翻页，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

1 数据建模

通常在做项目的过程中，在items.py中进行数据建模；如果字段很少时，可以不建模

1.1为什么建模

定义item即提前规划好哪些字段需要抓，防止手误，因为定义好之后，在运行过程中，系统会自动检查
配合注释一起可以清晰的知道要抓取哪些字段，没有定义的字段不能抓取，在目标字段少的时候可以使用字典代替
使用scrapy的一些特定组件需要ltem做支持，如scrapy的ImagesPipeline管道类，百度搜索了解更多

1.2 如何建模

在items.py文件中定义要提取的字段:

class MyspiderIterm(scrapy.Item):
    name = scrapy.Fie1d() # 讲师的名字
    title = scrapy.Field() # 讲师的职称
    desc = scrapy.Field() # 讲师的介绍

1.3 如何使用模板类

模板类定义以后需要在爬虫中导入并且实例化。之后的使用方法和使用字典相同:

注意:

from myspider.items import Myspiderltem这一行代码中注意item的正确导入路径，忽略pycharm标记的错误<

这篇关于Python网络爬虫笔记12：Scrapy进阶之数据建模与翻页的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯