scrapy 保存到mysql_Scrapy保存数据到mysql

2023年10月5日下午9:59 • Python • 阅读 34

scrapy pipeline 文件如下：class JianshuPipeline(object):

def init(self):

data = {

‘host’:’localhost’,

‘port’:3306,

‘user’:’root’,

‘password’:’**’,

‘database’:’jianshu’,

‘charset’:’utf8mb4′

self.conn = pymysql.connect(**data)

self.cursor = self.conn.cursor()

self._sql = None

def process_item(self, item, spider):

self.cursor.execute(self.sql, (item[‘title’],item[‘author’],item[‘pub_time’],item[‘origin_url’],item[‘content’],item[‘read_count’],item[‘like_count’],item[‘word_count’],item[‘comment_count’]))

self.conn.commit()

return item

@property

def sql(self):

if not self._sql:

self._sql =

“insert into article2(title,author, pub_time,origin_url,content,read_count, like_count,word_count,comment_count) values(%s,%s,%s,%s,%s,%d,%d,%d,%d)

return self._sql

item 文件如下class JianshuItem(scrapy.Item):

title = scrapy.Field()

author = scrapy.Field()

pub_time = scrapy.Field()

origin_url = scrapy.Field()

content = scrapy.Field()

read_count = scrapy.Field()

like_count = scrapy.Field()

word_count = scrapy.Field()

comment_count = scrapy.Field()

数据存入mysql数据库之前没有错误，存mysql数据库报错：

You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near…

初步怀疑数据库建表出错，用 Navicat Premium 重新建表之后继续报错，Navicat Premium 建表不会出错，给定的数据类型检查没有错误,建表出错问题排除。继续报错有可能是传入数据的时候出错，继续测试，将传参改为如下：self.cursor.execute(self.sql, (‘测试用’，’测试用’，’测试用’，’20190101’，’测试用’，’测试用’，’测试用’，10，20，20，10，’测试用’，))

正常运行没有报错

现在来看只能是item传参时出错，在写入数据库之前打印各个参数的值发现均没有错误，各方面独自运行均没错，只能是结合的时候出错，找传参时名字有没有写错，果然发现爬虫文件item实例化的时候类的名字写错，写的时候是复制的，粘贴了上次类的名字，导致传参的时候参数不对，将爬虫文件item实例化时候类的名字改为JianshuItem，数据成功保存到数据库中

Original: https://blog.csdn.net/weixin_42395135/article/details/113259389
Author: 方外俗汉释悟修
Title: scrapy 保存到mysql_Scrapy保存数据到mysql

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/792102/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python接口自动化实战案例

一、Python之requests学习数据存储在别的地方的数据库中，我想在我的电脑上看到数据。如何从别的设备上把数据拿过来，然后做一定的处理，放在我的界面上展示出来呢？接口是个…

Python 2023年8月4日
0057
Linux环境使用Docker手工部署Flask项目

网上大部分关于Docker部署Flask项目的教程，都没告知需要在Linux环境下部署，所以会导致整个教程看下来，在windows系统实操，都是失败的。第一步，在自己的window…

Python 2023年8月13日
0068
华为云服务-运维篇-负载均衡介绍与平台算法使用

文章目录 1、前言 2、负载均衡的分类 * 2.1、硬件负载均衡 2.2、软件负载均衡 2.3、本地负载均衡 2.4、全局负载均衡 3、负载均衡算法 * 3.1 分类介绍 3.2 …

Python 2023年10月9日
0048
python 一键登录微信分析好友性别地址生成结果

-*- coding:utf-8 -*- """ author：Mr Yang data：2019/09/26 """ …

Python 2023年6月10日
0090
【leet-code】219. 存在重复元素 II之Python enumerate() 函数

class Solution (object ): def containsNearbyDuplicate (self , nums , k ): dict ={} 1、方法1 此…

Python 2023年6月6日
0070
UE4 获取HTTP接口数据（UE4与python通信）

目录一、UE4请求HTTP接口二、UE4解析Json 三、案例通过调用接口实现方块每秒上移5个单位一、UE4请求HTTP接口步骤： 1.从https://github.c…

Python 2023年8月10日
0053
Pandas使用unstack()行转列时报错：Index contains duplicate entries, cannot reshape

stack()即”堆叠”，作用是将列旋转到行unstack()即stack()的反操作，将行旋转到列 unstack(): Series对象的API，用于将…

Python 2023年8月17日
0031
python人名统计_「姓名分析」Python|美国婴儿姓名分析 – seo实验室

姓名分析 01 起我们拿到一份1880-2016这136年间美国婴儿取名的数据(数据源在这里下载)，数据总共有189万条，57.7M的大小，字段如下：下面我们使用Python3…

Python 2023年8月7日
0031
Gunicorn+django部署

部署前提是服务器中要有项目中所需的其他服务，例：mysql数据库，nginx，python解释器等，在其他环境搭好的情况下使用此方式可简单部署一个django项目。 1、准备工作 …

Python 2023年6月3日
0063
技术管理之如何协调加班问题

今天刚好跟一个前同事聊一些以前加班的事情，他跟我吐槽公司加班的问题，但我管理的技术部门一直没怎么加班。就想起来之前为了达成这件事做的一些努力，本来想细说，但他好像不太感兴趣，结果我…

Python 2023年10月14日
0049
p10.第一章 Python基础入门 — 习题详解(十)

1.3.4.3 打印下图菱形 * *** ***** ******* ***** *** * 思路1：前置空格行号 i 星个数前空格数后空格数总空格数 1 -3 1 3 3…

Python 2023年9月16日
0066
Pandas常用累计、同比、环比等统计方法实践案例

统计表中常常以本年累计、上年同期（累计）、当期（例如当月）完成、上月完成为统计数据，并进行同比、环比分析。如下月报统计表所示样例，本文将使用Python Pandas工具进行统计。…

Python 2023年8月8日
0065
【数学模型】层次分析

Hello大家好，今年数学建模国赛将于9月中旬举行，是时候提前做一些准备了。本次模型非常简单，只是介绍比较得详细，我下次注意，争取限制下字数。文末准备了层次分析-python模…

Python 2023年8月2日
0054
python全系列之爬虫scrapy_Python爬虫系列教程07之初识Scrapy爬虫框架

配套视频教程概览在具体的学习scrapy之前，我们先对scrapy的架构做一个简单的了解，之后所有的内容都是基于此架构实现的，在初学阶段只需要简单的了解即可，之后的学习中，你会…

Python 2023年10月6日
0025
Matplotlib饼图实例

本人是Python编程爱好者，享受编程的乐趣和喜欢与大家分享学习心得。文章目录前言一、首先引入相关Python库二、实例Demo 1.1 官方Demo 1.2 将实际数据应…

Python 2023年8月31日
0046
Docker学习笔记

镜像（image)：docker镜像就好比是一个目标，可以通过这个目标来创建容器服务，tomcat镜像==>run==>容器（提供服务器），通过这个镜像可以创建多个容器…

Python 2023年6月3日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

scrapy 保存到mysql_Scrapy保存数据到mysql

大家都在看