python_爬虫 18 Scrapy框架之（四）Scrapy Shell

2023年10月6日下午7:21 • Python • 阅读 46

Scrapy Shell

我们想要在爬虫中使用xpath、beautifulsoup、正则表达式、css选择器等来提取想要的数据。但是因为 scrapy是一个比较重的框架。每次运行起来都要等待一段时间。因此要去验证我们写的提取规则是否正确，是一个比较麻烦的事情。因此 Scrapy提供了一个shell，用来方便的测试规则。当然也不仅仅局限于这一个功能。

打开Scrapy Shell

打开cmd终端，进入到 Scrapy项目所在的目录，然后进入到 scrapy框架所在的虚拟环境中，输入命令 scrapy shell [链接]。就会进入到scrapy的shell环境中。在这个环境中，你可以跟在爬虫的 parse方法中一样使用了。

查询获取到的网页信息：

总结：

1、可以方便我们做一些数据提取的测试代码
2、如果想要执行scrapy 命令，那么肯定要先进入到 scrapy 所在的环境中。
3、如果想要读取某个项目的配置信息，那么应该先进入到项目中，再执行 scrapy shell 命令。

更多内容有待研究。。。

Original: https://blog.csdn.net/qq_30346413/article/details/117768325
Author: 思想流浪者
Title: python_爬虫 18 Scrapy框架之（四）Scrapy Shell

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/792796/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python 【问题描述】按照世卫组织的标准：男性：（身高cm-80）×70%=标准体重女性：（身高cm-70）×60%=标准体重标准体重正负10%为正常体重(含10%) 标准体重正负1

【问题描述】按照世卫组织的标准：男性：（身高cm-80）×70%=标准体重女性：（身高cm-70）×60%=标准体重标准体重正负10%为正常体重(含10%) 标准体重正负10…

Python 2023年8月8日
0054
Data Analysis–＞＞pandas（1）introduction

1.pandas是python处理表格数据的一个库！！！导入如下（as pd 是我们用pd来代替pandas，因为简单）： import pandas as pd 2.用pand…

Python 2023年8月9日
0061
基于pandas、matplotlib和seaborn进行数据分析实战【kaggle】

大家早上好，本人姓吴，如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界，一起学习！感兴趣的朋友可以关注我或者我的数据分析专栏，里面有许多优质的文章跟大家…

Python 2023年9月6日
0049
python的join函数的用法及实例

目录 1.join函数的语法及用法（1）语法：’sep’.join(sep_object) （2）用法：连接任意数量的字符串（包括要连接的元素字符串、元组…

Python 2023年7月31日
00123
Python主要的应用领域有哪些？

作为一个实用主义的学习者，最关心的问题一定是 “我为什么要选择学Python，学会之后我可以用来做什么？”。在上篇《为什么选择Python入门》文章中，我…

Python 2023年10月30日
0034
变量的定义和使用

在编程语言中，变量是指可以存储和表示数据的抽象概念，可以理解为存储数据的容器。可以通过变量名访问变量中的值。 [En] In programming languages, vari…

Python 2023年5月23日
0054
python使用matplotlib的plt.subplot、plt.subplots绘制多图以及图例legend注意事项

文章目录 * – 摘要 – 方法1：未使用返回值的plt.subplot – 方法2：使用返回值的plt.subplot – 方法3…

Python 2023年9月7日
0052
数据分析（第三天）

探索性数据分析 import numpy as np import pandas as pd 了解你的数据吗？ arr = np.arange(8).reshape((2, 4))…

Python 2023年8月8日
0040
Python基础day23：绝对导入和相对导入、模块化编程简介、软件开发目录规范、常见内置模块collections和time

day23今日内容概要： 1.绝对导入与相对导入 2.包的概念（package） 3.模块化编程思想简介 4.软件开发目录规范 5.常见内置函数：collections和time …

Python 2023年5月23日
0051
Django静态资源管理

当我们配置Django的静态文件时，在 setting.py中主要设计如下几行代码 setting.py Build paths inside the project like t…

Python 2023年8月5日
0040
Python文件管理

Python文件管理一、 os模块 1、方法大纲 2、常用方法二、 glob模块 1、方法大纲 2、使用示例三、 shutil模块 1、方法大纲 2、压缩包四、…

Python 2023年6月9日
0054
数据分析神器：数据自动录入并生成BI报表

做报表、分析数据、做汇报是许多打工人的日常，每天都要耗费不少的时间用Excel来整理、清洗数据和生成好看的报表。如果这些数据都是手动整理、复制粘贴的话，不仅费时费力，而且很容易出错…

Python 2023年9月16日
0031
Python流行的轻量级web框架-Flask

Web开发大致分为两个方面-客户端（Frontend）和服务器端（Backend）。每当我们在浏览器中输入任何网站的URL时，浏览器就会向服务器发出请求，服务器确认该请求并提供网站…

Python 2023年8月14日
0044
linuxsed替换字符串后保存_字符串方法——replace()

1、字符串方法—— replace() str.replace(old, new[,max]) 参数说明(Parameters) old：被替换的字符串 new：新字符串，替换原来…

Python 2023年8月21日
0071
【机器学习】numpy实现Adam优化器

💥 项目专栏：【Python实现经典机器学习算法】附代码+原理介绍文章目录前言一、Adam优化原理二、更新规则三、迭代过程四、代码实践前言 👑 最近粉丝群中很多朋友私…

Python 2023年8月25日
0053
【手撕LSTM】LSTM的numpy实现

文章目录 * – LSTM原理图 – + 便于程序实现的公式（简化版公式） + 关于”门” + * 遗忘门 * 输入门 * 更新me…

Python 2023年8月27日
0076

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python_爬虫 18 Scrapy框架之（四）Scrapy Shell

Scrapy Shell

打开Scrapy Shell

总结：

大家都在看