Scrapy常用的命令

短命女 2022-05-15 08:30 219阅读 0赞

1.查看帮助命令
scrapy -h
scrapy –help

2.查看版本信息
scrapy version
scrapy version -v

3.全局命令和项目命令文档截图
这里写图片描述

4.全局命令

a)创建项目（startproject）
scrapy startproject testproject
这里写图片描述

b)创建蜘蛛，默认模板basic，一个项目可以创建多个蜘蛛(genspider)
cd testpeoject
scrapy genspider testspider baidu.com
scrapy list
所有模板：
basic 基础
crawl自动爬虫
csvfeed用来处理csv文件
xmlfeed用来处理xml文件
模板命令：scrapy genspider -t basic testspider www.baidu.com，创建了一个带模板的testspider蜘蛛
这里写图片描述

c)运行蜘蛛（runspider）
命令行切换到spiders文件夹下，然后runspider
scrapy runspider testspider.py

d)交互式终端(shell)
进入终端：scrapy shell ‘www.baidu.com’
查看状态： response
显示网页html:response.text
xpath匹配数据：response.xpath(‘//div[@class=”head_wrapper”]’)
退出终端：exit()
这里写图片描述

e)打印heml(fetch）
scrapy fetch –nolog http://www.example.com/some/page.html

f)本地查看网页(view)
查看本地豆瓣主页，文件保存在本地，可加载动态js，提供网页动态数加载分析：scrapy view https://www.douban.com

g)查看版本信息(version)
scrapy version -v
i)查看配置文件节点（settings）
scrapy settings –get BOT_NAME

5.项目命令（目录切换到项目目录下）
a).运行蜘蛛（crawl）
scrapy crawl testspider

b).测试爬虫，编译是否由错误(check)
scrapy check testspider
这里写图片描述

c).显示所有蜘蛛
scrapy list

d).编辑器打开爬虫(edit)
scrapy edit testspider

e).执行请求后，回调函数，yield到Item(parse)
scrapy parse http://www.example.com/ -c TestprojectItem
这里写图片描述

f).测试本地硬件性能(bench)
scrapy bench

发表评论取消回复

表情：

评论列表（有 0 条评论，219人围观）

还没有评论，来说两句吧...

相关阅读

相关 scrapy命令明细：全局命令

接下来我们来一一介绍[scrapy][]命令有哪些，其实灰常少，也就十四五个，在这十四五个中，常用的就纳么两三个而已，如： scrapy startproject（创

忘是亡心i/ 2022年12月21日 10:51/ 0 赞/ 203 阅读

相关 scrapy命令明细：全局命令

接下来我们来一一介绍[scrapy][]命令有哪些，其实灰常少，也就十四五个，在这十四五个中，常用的就纳么两三个而已，如： scrapy startproject（创

谁践踏了优雅/ 2022年10月06日 00:53/ 0 赞/ 222 阅读

相关常用的docker命令

常用命令 1. 查看容器的root用户密码 docker logs <容器名orID> 2>&1 | grep '^User: ' | tai

旧城等待，/ 2022年09月25日 07:23/ 0 赞/ 245 阅读

相关 Scrapy命令行功能--scrapy shell

> 本文首发于我的博客：[gongyanli.com][] > 我的简书：[https://www.jianshu.com/p/90a6820635f8][https_ww

缺乏、安全感/ 2022年05月31日 03:45/ 0 赞/ 306 阅读

相关 Scrapy命令行

>scrapy <command> \[ options \] \[ args \] command 命令 ![70][] [70]: /image

我不是女神ヾ/ 2022年05月24日 01:41/ 0 赞/ 259 阅读

相关常用的ADB命令

<table> <thead> <tr> <th align="left">指令</th> <th align="center">作用</th>

忘是亡心i/ 2022年05月20日 05:35/ 0 赞/ 382 阅读

相关 Scrapy常用的命令

1.查看帮助命令 scrapy -h scrapy –help 2.查看版本信息 scrapy version scrapy version -v 3.全局

短命女/ 2022年05月15日 08:30/ 0 赞/ 220 阅读

相关 sed 常用的命令

n: 读取一行，执行n，把当前行打印到标准输出，再读取一行，覆盖当前行，然后对模式空间执行一组模式/行为。 N：读取一行，执行N，再读取一行，现在模式空间有两行内容，执行一

深藏阁楼爱情的钟/ 2021年11月01日 12:58/ 0 赞/ 355 阅读

相关常用的Linux命令

基本命令及其用法 1. `ls` 查看当前目录下的文件，后也可接目录，例如 `ls /root/`这样是在查root下的文件。 2. `ll` 等于 `ls -l`或

你的名字/ 2021年09月28日 15:04/ 0 赞/ 488 阅读

相关 gitlab常用的命令

gitlab-ctl start 启动 gitlab-ctl stop 停止 gitlab-ctl status 查看状态 gitlab-ctl restart 重启

墨蓝/ 2021年09月20日 06:20/ 0 赞/ 412 阅读