python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2023年10月5日下午10:40 • Python • 阅读 47

下载代码Cookie池(这里主要是微博登录，也可以自己配置置其他的站点网址)

下载代码GitHub：https://github.com/Python3WebSpider/CookiesPool

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作！！！！！！！！！！！！！

自己的设置主要有下面几步：

1、配置其他设置

2、设置使用的浏览器

3、设置模拟登陆

源码cookies.py的修改(以下两处不修改可能会产生bug)：

4、获取cookie

随机获取Cookies： http://localhost:5000/weibo/random(注意：cookie使用时是需要后期处理的！！)

简单的处理方式，如下代码(偶尔需要对获取的cookie处理)：

def get_cookie(self):

return requests.get(‘http://127.0.0.1:5000/weibo/random’).text

def stringToDict(self,cookie):

itemDict = {}

items = cookie.replace(‘:’, ‘=’).split(‘,’)

for item in items:

key = item.split(‘=’)[0].replace(‘ ‘, ”).strip(‘ “‘)

value = item.split(‘=’)[1].strip(‘ “‘)

itemDict[key] = value

return itemDict

scrapy爬虫的使用示例(爬取微博)：

middlewares.py中自定义请求中间件

def start_requests(self):

ua = UserAgent()

headers = {

‘User-Agent’: ua.random,

}

cookies = self.stringToDict(str(self.get_cookie().strip(‘{|}’)))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

cookies = self.stringToDict(str(self.get_cookie().strip(‘{|}’)))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

settings.py 中的配置：

5、录入账号和密码：

格式规定(账号—-密码)

6、验证：(注意：使用cmd)

7、使用时注意保持cmd打开运行！！

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要！！)类比第4步！！！

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

本文标题: Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

本文地址: http://www.cppcns.com/jiaoben/python/373587.html

Original: https://blog.csdn.net/weixin_39856589/article/details/113638189
Author: weixin_39856589
Title: python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/792124/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于Python构建机器学习Web应用

目录一、内容介绍 1.Onnx模型 ①skl2onnx库安装 2.Netron安装二、模型构建 1.数据加载 2.划分可训练特征与预测标签 3.训练模型 ①第三方库导入 ②数据…

Python 2023年9月29日
0039
python函数手册 stata_Python与Stata在数据处理区别

来源：Pandas中文网本节旨在演示如何在 pandas 中做各种类似Stata的操作。按照惯例，我们按如下方式导入 pandas 和 NumPy：# 计量经济学服务中心imp…

Python 2023年8月21日
0047
Python吃喝玩乐：爬取全城按摩门店，看看有没有你想去的！

import requests import pprint import re import csv import time f = open(‘按摩data.csv’, mode…

Python 2023年5月25日
0057
人工智能AI 生成的艺术：从文本到图像

人工智能生成艺术简史首先，让我们把事情弄清楚一点。”人工智能与艺术”一般可以从两个方面来理解：人工智能在分析现有艺术的过程中人工智能在创造新艺术的过程…

Python 2023年9月28日
0080
python非线性规划scipy.optimize.minimize介绍

在 python 里用非线性规划求极值，最常用的就是 scipy.optimize.minimize()。 最小化…

Python 2023年8月2日
0066
Python数学基础-识图一、平面直角坐标系

目录 1、轴坐标系X轴·数轴辅助教学模拟器 2、平面直角坐标系点坐标的表示方式：坐标轴上的点的特征两条坐标轴夹角平分线上点的坐标的特征和坐标轴平行的直线上点的坐标的特征关…

Python 2023年7月31日
0066
Centos8上安装Mysql8.X

一、下载Mysql 下载地址：https://dev.mysql.com/downloads/mysql/ 二、将压缩包通过ftp软件服务器的目标位置：并解压 1、我的是放在：/r…

Python 2023年6月9日
0089
天池数据-耳机情感分析

import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt i…

Python 2023年8月8日
0059
手把手教你使用Python解决简单的zip文件解压密码

Original: https://www.cnblogs.com/pythonQqun200160592/p/15508588.htmlAuthor: python可乐编程Tit…

Python 2023年5月25日
00126
网络项目知识要点

posted @2022-06-20 16:08 Ant_blog 阅读(14 ) 评论() 编辑 Original: https://www.cnblogs.com/WorldN…

Python 2023年6月15日
0074
CUDA升级和版本切换方法

1.查看CUDA版本 echo $PATH 输出:/usr/local/cuda-11.1/bin:/usr/local/cuda-10.1/bin:… 哪个在前面哪个…

Python 2023年10月9日
0047
gym包升级后炼丹炉的测试代码

关于gym包升级到0.26.2版本后炼丹炉测试代码的修改前两天电脑有问题，重装了系统。就有了关于安装了更新后的软件包跑环境测试代码遇到的问题。本文包版本分别为——gym vers…

Python 2023年9月17日
0065
【数据挖掘】pandas使用手册

前言等到了我们学校的数据挖掘课程，就从最简单的pandas开始记录我的数据挖掘学习历程吧！希望这份手册能在之后需要的时候帮助到大家。 pandas使用手册第一部分：series…

Python 2023年8月16日
0066
python制作2048游戏

from tkinter.messagebox import * from pygame.locals import * from random import * import t…

Python 2023年9月24日
0040
Django（74）drf-spectacular自动生成接口文档

介绍 drf-spectacular是为 Django REST Framework生成合理灵活的 OpenAPI 3.0模式。它可以自动帮我们提取接口中的信息，从而形成接口文档，…

Python 2023年8月4日
0071
SpringBoot+Vue物流仓储管理系统

项目背景在信息化的时代，效率和速度就变得尤为重要了，具有高效率和速度就具有更好的竞争力，更受客户欢迎。与此同时，网购与人们的生活息息相关，顾客在网上购买的商品需要通过物流公司对这…

Python 2023年10月8日
0033

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

大家都在看