python——scrapy利用cookie模拟登录

python——scrapy利用cookie模拟登录
适用场景:cookie过期时间较长,足够你完成爬取过程

文章目录

1、基础

2、找cookie,改start_urls

3、cookie转为字典

4、修改setting.py

1、基础

创建项目

scrapy startproject 名称

生成爬虫

scrapy genspider 爬虫名 允许爬取域名

运行

scrapy crawl 爬虫名

2、找cookie,按F12寻找,一般在network的第一个包中;将start_urls改为豆瓣网址,以豆瓣为例

python——scrapy利用cookie模拟登录
python——scrapy利用cookie模拟登录

3、cookie转为字典,构造请求并把请求交给引擎,callback指定解析函数名称,默认为parse;cookie接受字典

python——scrapy利用cookie模拟登录
4、更改setting中的user_agent和和注释掉ROBOTSTXT_OBEY
python——scrapy利用cookie模拟登录

完成,部分结果截图

python——scrapy利用cookie模拟登录

Original: https://blog.csdn.net/qq_46738968/article/details/122312783
Author: qq_46738968
Title: python——scrapy利用cookie模拟登录

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/789096/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球