scrapy的初始化的一些设定

工欲善其事必先利其器,scrapy工程创建好以后,需要简单设定几个参数,来开启使用

第一个:

源文件下的 allowed_domains这个变量需要注释掉,这个变量用来限定哪些进行请求,不在列表中的不进行请求,所以要注释掉,代表对请求不做限制

scrapy的初始化的一些设定

第二个:

setting.py文件中的ROBOTSTXT_OBEY = True改为ROBOTSTXT_OBEY = False,

setting.py是scrapy的设置文件,ROBOTSTXT_OBEY参数是确定是否遵守网站的robots协议,建议自学的时候改为False

Original: https://blog.csdn.net/ragerabbitr/article/details/122145123
Author: ragerabbitr
Title: scrapy的初始化的一些设定

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/790254/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • [WesternCTF2018]shrine

    打开是一段代码,写规范一点 import flask import os app = flask.Flask(__name__) app.config[‘FLAG’] = os.e…

    Python 2023年8月13日
    065
  • Python报错ValueError: arrays must all be same length

    遇到这样的报错 ValueError: All arrays must be of the same length 问题分析和解决方式,如下: import pandas as p…

    Python 2023年8月17日
    045
  • 2-Allure的使用

    文章目录 * – Allure简介 – Allure环境搭建 – Allure使用示例 – Allure层级的设置 – …

    Python 2023年9月12日
    064
  • MySQL详细教程,2023年硬核学习路线

    文章目录 前言 1. 数据库的相关概念 * 1.1 数据 1.2 数据库 1.3 数据库管理系统 1.4 数据库系统 1.5 SQL 2. MySQL数据库 * 2.1 MySQL…

    Python 2023年11月7日
    048
  • 教你用Python实现经典游戏《弹珠台》

    弹球游戏如此之多,以至于它本身已经成为一种类型。弹球起源于一种模拟街机,一个金属球将被发射到一个倾斜的游戏区域,并在障碍物之间弹跳。玩家通过按下机器两侧的按钮来操作一对脚蹼,从而将…

    Python 2023年9月22日
    035
  • SHAP可视化

    文章目录 * – 安装 – + 问题1:numpy版本冲突 – 解释器 – 条形图 – 蜂群图 – 依赖图 …

    Python 2023年8月27日
    058
  • Python小技之不用 GUI,照样实现图形界面

    文 | 李晓飞 来源:Python 技术「ID: pythonall」 如果说程序员有什么怕的,那我想可能就是 —— 需求又变了! 这不,客户在笔者开发完一个基于浏览器的 Web …

    Python 2023年8月10日
    045
  • matplotlib自定义风格

    使用matplotlib进行绘图时,经常遇到个问题,就是总是要花大量代码对绘图的格式进行设置。虽然可以将同一类绘图的代码保存以后使用,但是看着这么长一串用来设置格式就很不爽。 一、…

    Python 2023年9月3日
    089
  • 京东云开发者|软件架构可视化及C4模型:架构设计不仅仅是UML

    软件系统架构设计的目标不在于设计本身,而在于架构设计意图的传达。图形化有助于在团队间进行高效的信息同步,但不同的图形化方式需要语义一致性和效率间实现平衡。C4模型通过不同的抽象层级…

    Python 2023年10月15日
    075
  • python flask智能租房项目——列表页

    蓝图 使⽤蓝图可以分为三个步骤创建⼀个蓝图对象 admin=Blueprint(‘admin’,__name__) 在这个蓝图对象上进⾏操作,注册路由,指定静态⽂件夹,注册模版过滤…

    Python 2023年8月11日
    098
  • python实验二数据预处理_数据清洗与预处理-Python实现

    这个Python版本必须是3.7的 首先讲一下数据清洗与预处理的定义 在百度百科中的定义是 – 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据…

    Python 2023年8月19日
    060
  • 【使用Pytest重构项目】Pytest简介与基本使用

    前言 一直想学习自动化测试,但是都没行动,业余时间学习零零碎碎并记录20210419。 6、使用pytest重构项目 pytest框架介绍 pytest标记 pytest参数处理 …

    Python 2023年9月12日
    062
  • 文字转图片,文字水印图片,合成图片,教你 Python 生成网站原创配图!

    又是为站佬们服务(写)水文的一篇,如何应用python来生成或者说是合成自己的原创图片,适合各位站群大佬哥们生成自己的图片,避免没有配图或者侵权碰瓷的尴尬,当然本渣渣这里分享的仅仅…

    Python 2023年9月18日
    052
  • ChatGPT写的一篇数字化转型文章

    文末附ChatGPT调戏链接,无需注册登录直接使用。 数字化转型是指企业利用数字技术来改善业务流程、增强竞争力和降低成本。它旨在帮助企业更快、更有效地实现业务发展和创新,并为客户提…

    Python 2023年11月4日
    039
  • 极客编程python入门-条件控制2/7

    极客编程python入门-条件控制2/7 精选原创 最爱大苹果2022-08-07 20:27:10博主文章分类:极客编程python学习 ©著作权 文章标签 条件控制语句 pyt…

    Python 2023年5月24日
    071
  • ChatGPT ,能替代程序员吗?

    最近朋友圈都在聊一个ai,知乎甚至一度上了热榜,现在已经有540个回答了 好嘛,既然咱也是个程序员,这不得体验一波? 当我火急火燎的点开时 乳化,赤裸裸的乳化! ; 体验 问题不大…

    Python 2023年11月4日
    048
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球