python scrapy爬虫遇见301_pycharm下打开、执行并调试scrapy爬虫程序的方法

2023年10月6日上午12:22 • Python • 阅读 44

首先得有一个Scrapy项目，我在Desktop上新建一个Scrapy的项目叫test，在Desktop目录打开命令行，键入命令：scrapy startproject test1

目录结构如下：

打开Pycharm，选择open

选择项目，ok

打开如下界面之后，按alt + 1，打开project 面板

在test1/spiders/，文件夹下，新建一个爬虫spider.py，注意代码中的name=”dmoz”。这个名字后面会用到。

在test1目录和scrapy.cfg同级目录下面，新建一个begin.py文件(便于理解可以写成main.py)，注意箭头2所指的名字和第5步中的name=’dmoz’名字是一样的。

上面把文件搞定了，下面要配置一下pycharm了。点击Run->Edit Configurations
新建一个运行的python模块
Name：改成spider； script：选择刚才新建的那个begin.py文件；Working Direciton：改成自己的工作目录
至此，大功告成了，点击下图，右上角的按钮就能运行了。

调试

可以在其他代码中设置断点，就可以debug运行

遇到问题

Unknown command: crawl

调试运行，断点并未命中，控制台输出信息如下：

工作目录设置有误，造成无法识别 scrapy 命令，按照上文所说，将工作目录设置为包含 scrapy.cfg，重新运行，问题解决。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持服务器之家。

原文链接：http://blog.csdn.net/u012052268/article/details/72063917

Original: https://blog.csdn.net/weixin_42181545/article/details/112941533
Author: 曲奇小朋友
Title: python scrapy爬虫遇见301_pycharm下打开、执行并调试scrapy爬虫程序的方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/792181/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Anaconda和pip异常

1 No module named ‘unicodedata’ 在使用Anaconda和Miniconda时，我们会建立多个环境。有时候为了迁移环境，会将e…

Python 2023年9月8日
0045
knn算法详解

1.什么是knn算法俗话说：物以类聚，人以群分。看一个人什么样，看他身边的朋友什么样就知道了(这里并没歧视谁，只是大概率是这样) 对于判断下图绿色的球是哪种数据类型的方法就是根据…

Python 2023年6月9日
0077
C#连接到SQL Server数据库

使用ADO.NET(ActiveX Data Objects)可以减少不同数据库系统带来的琐碎事情。 ADO.NET是一组公开数据访问服务的类。主要组成： .NET 数据提供程序…

Python 2023年10月8日
0045
初学python加Django 框架的第一天

本人是做测试的，学习python你懂的，技多不压身，今天开始记录学习的全过程，下面语言通俗易懂，小白也看的懂 1.首先，你得有一个写代码的东西，我们首选pycharm，可以按照菜鸟…

Python 2023年8月4日
0071
pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行（不进行数据保留）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月16日
0028
PyCharm安装selenium及Chrome环境配置（超详细）

一、安装Python 1、下载官网下载链接：Python Releases for Windows | Python.org Install Now：安装到默认路径 Custom…

Python 2023年8月2日
0084
ubuntu20下Cuckoo SandBox安装教程–大踩坑版（一）

ubuntu20下Cuckoo SandBox安装说明天坑1: 系统架构天坑2: python2.7 * python2.7安装 pip2.7安装天坑3: Cuckoo依赖…

Python 2023年9月22日
0075
经典背包系列问题

经典背包系列问题作者：Grey 原文地址：博客园：经典背包系列问题 CSDN：经典背包系列问题问题一题目描述在 n 个物品中挑选若干物品装入背包，最多能装多满？假设背包的…

Python 2023年10月16日
0040
将塑造未来世界的十大web3技术

一些重要的 Web 3.0 技术，包括以下技术，有助于定义第三代 Web 可能的全部内容： 1. 区块链技术区块链是记录所有点对点交易的去中心化账本。参与者无需使用该技术的中央清…

Python 2023年11月8日
0046
教育部认可的57项全国大学生学科竞赛

中国”互联网+”大学生创新创业大赛https://cy.ncss.org.cn/ “挑战杯”全国大学生课外学术科技作品竞赛 &#82…

Python 2023年6月3日
00105
6、RequestMappingHandlerMapping请求地址映射的初始化流程！

之前的文章里，介绍了 DispatcherSerlvet处理请求的流程。其中一个核心的步骤是：请求地址映射，即根据 request获取对应的 HandlerExcecutionCh…

Python 2023年10月12日
0033
windows + vs2017 + matplotlib-cpp 简洁版

科目： vs2017 调用matplotlib-cpp可视化绘图内容： matplotlib-cpp编译 + vs2017配置，完成调用目的：通过本次讲解，使兄弟们完成vs2…

Python 2023年9月5日
0058
打造企业自己代码规范IDEA插件（上）

——基于阿里巴巴代码规范插件（P3C） “交流互鉴是文明发展的本质要求。只有同其他文明交流互鉴、取长补短，才能保持旺盛生命活力。” 这说的是文明，但映射到计…

Python 2023年10月20日
0034
用pandas和numpy分析药店的营业数据

以下是某连锁药店销售数据，请使用numpy、pandas相关做分析。要求如下：‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪…

Python 2023年8月26日
0032
从零开始的天天生鲜项目

——Django天天生鲜项目环境：Python 3.8.10Ubuntu 9.3.0-17ubuntu1~20.04Tinymce 2.7.0MySQL …

Python 2023年8月5日
0035
从零开始数据分析Kaggle项目——泰坦尼克号（五）

从零开始数据分析Kaggle项目—泰坦尼克号2—2.1 import pandas as pd import numpy as np df = pd.read_csv("…

Python 2023年8月8日
0052

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python scrapy爬虫遇见301_pycharm下打开、执行并调试scrapy爬虫程序的方法

大家都在看