C/C++教程

Scrapy的基本使用

本文主要是介绍Scrapy的基本使用，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

一、基本命令

创建项目scrapy startproject xxx
创建爬虫scrapy genspider xxx
运行相应爬虫scrapy crawl xxx

二、相关文件

1、相应的爬虫文件名称为自己创建的的xxx.py

2、爬虫项目的配置文件setting.py

ROBOTSTXT_OBEY 是否遵循robots.txt协议
USER_AGENT 爬虫请求时的请求头
DOWNLOAD_DELAY 爬虫请求的频率
ITEM_PIPELINES 是否打开管道
LOG_ENABLED 是否打印日志
LOG_LEVEL 打印日志的最低标准
...

3、管道，处理爬虫发过来的数据pipelines.py

4、一些中间件设置middlewares.py

5、变量类型（建议直接用字典）items.py

三、其他

crawlspider自动查找新url地址并下载
ImagePipeline图片下载保存管道

这篇关于Scrapy的基本使用的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯