scrapy 两类item_在scrapy中嵌套Item数据的正确方法

2023年10月3日下午7:36 • Python • 阅读 46

评论更新：看起来

nested loaders是更新的方法.另一条评论表明这种方法会在序列化过程中导致错误.

解决这个问题的最佳方法是创建一个main项和一个元项类/加载器.

from scrapy.item import Item, Field

from scrapy.contrib.loader import ItemLoader

from scrapy.contrib.loader.processor import TakeFirst

class MetaItem(Item):

url = Field()

added_on = Field()

class MainItem(Item):

price = Field()

title = Field()

meta = Field(serializer=MetaItem)

class MainItemLoader(ItemLoader):

default_item_class = MainItem

default_output_processor = TakeFirst()

class MetaItemLoader(ItemLoader):

default_item_class = MetaItem

default_output_processor = TakeFirst()

样品用法：

from scrapy.spider import Spider

from qwerty.items import MainItemLoader, MetaItemLoader

from scrapy.selector import Selector

Original: https://blog.csdn.net/weixin_42452460/article/details/113021924
Author: 胡萝卜伞
Title: scrapy 两类item_在scrapy中嵌套Item数据的正确方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/790483/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pandas的学习之——使用Pandas进行描述性统计

首先引入需要的库 import numpy as np import pandas as pd import matplotlib.pyplot as pyplot 读取数据 ra…

Python 2023年9月4日
0083
使用 Kubeadm 部署 Kubernetes(K8S) 安装

1. 安装要求在开始之前，部署Kubernetes集群机器需要满足以下几个条件：一台或多台机器，操作系统 CentOS7.x-86_x64 硬件配置：2GB或更多RAM，2个C…

Python 2023年10月19日
0086
Asp.Net Core&Jaeger实现链路追踪

前言随着应用愈发复杂，请求的链路也愈发复杂，微服务化下，更是使得不同的服务分布在不同的机器，地域，语言也不尽相同。因此需要借助工具帮助分析，跟踪，定位请求中出现的若干问题，以此来…

Python 2023年10月14日
0063
如何在 PyGame 中初始化所有导入的模块

14天学习训练营导师课程：李宁《Python Pygame游戏开发入门与实战》李宁《计算机视觉OpenCV Python项目实战》1李宁《计算机视觉OpenCV Python项目实…

Python 2023年9月18日
0061
Google Earth Engine（GEE）——Python 干旱指标PDSI和植被指数NDVI之间的关系

散点图是可视化两个变量之间关系的好方法。在这里，PDSI（干旱指标）将绘制在 x 轴上，NDVI（植被生产力）绘制在 y 轴上。为此，两个变量必须存在于同一个 DataFrame …

Python 2023年8月7日
0090
Jmeter——BeanShell 内置变量vars、props、prev的使用

在使用Jmeter过程中，或多或少都会接触些BeanShell，它会使工具的使用，变得更灵活。 Jmeter中关于BeanShell的有： 1.BeanShell Sampler …

Python 2023年10月19日
0036
爬虫日记(17)：scrapy的Item对象

我们知道为什么要写爬虫，因为网上有很多有用的信息，但是这些信息是非结构化的，散乱地分布的，数据非常巨大的。可以把这些数据当作原油，正等待我们去开采，在开采之后还需要进行一番炼油，才…

Python 2023年10月4日
0046
Python中把字典dic转换为DataFrame

有时候，需要把dic转换为DataFrame格式，便于查看和存储。假设有以下的dic： dic={‘a’:”1″, ‘b’: “2”, ‘c’:’3′} 本文来探讨一下把它转换为…

Python 2023年8月17日
0064
Pygame实战：程序员小哥给女友写了一款锻炼反应能力的游戏，从此上班摸鱼再也没被扣工资。

导语上班摸鱼有没有玩游戏啊！如果没有那你也肯定没有玩坠落的小鸟主题游戏咯~ 不过没有关系木子这就放大图给你过过眼瘾：看看这个界面还真有app游戏软件哪味儿了！这个可…

Python 2023年9月21日
0047
尝试理解Linux容器进程与宿主机共享内核的具体含义

背景近期接触容器技术时，经常看到各类比较容器与虚拟机区别的文章中会提到：容器是共享宿主机的内核，而虚拟机则是拥有自己独立的内核，所以不可能在Linux上用容器运行windows，…

Python 2023年10月23日
0074
pytest之fixture

文章目录 fixture的介绍 fixture的基本应用 * fixture自定义装饰器 fixture参数： fixture scope参数详解： conftest.py实现数据…

Python 2023年9月9日
0056
Flask-SQLAlchemy简单搭建与操作

flask中一般使用flask-sqlalchemy来操作数据库，使用起来比较简单，易于操作。 pip install flask-sqlalchemy 配置选项说明连接数据库。…

Python 2023年8月14日
0057
Pandas–melt和pivot

Pandas中melt和pivot函数 melt和pivot函数说明 * 数据准备数据处理函数说明 melt和pivot函数说明 melt函数和pivot函数通常用来进行数据表…

Python 2023年8月9日
0076
在nodejs中体验http/2

前言 2015年，HTTP/2 发布，直到2021年公司的项目才开始在实践中应用；自己对http2诸多特点的理解只存在于字面上，于是尝试在nodejs中实践一下，加深自己的理解。 …

Python 2023年10月11日
0048
（四）Python PyTest 用例执行排序与常用指令-持续更新

可以通过编写自定义插件或使用 html插件来获取用结果。使用 html插件可以将测试结果生成HTML报告，其中包含每个测试用结果、运行时间、失败原因等信息。可以通过以下命令安…

Python 2023年9月14日
0058
Python库-pandas详解

1. pandas介绍 2. Series 3. DataFrame * 3.1 DataFrame结构 3.2 DataFrame属性与方法 3.2 DataFrame索引的设置…

Python 2023年8月19日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

scrapy 两类item_在scrapy中嵌套Item数据的正确方法

大家都在看