python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2、设置使用的浏览器

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

3、设置模拟登陆

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

源码cookies.py的修改(以下两处不修改可能会产生bug):

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):

return requests.get(‘http://127.0.0.1:5000/weibo/random’).text

def stringToDict(self,cookie):

itemDict = {}

items = cookie.replace(‘:’, ‘=’).split(‘,’)

for item in items:

key = item.split(‘=’)[0].replace(‘ ‘, ”).strip(‘ “‘)

value = item.split(‘=’)[1].strip(‘ “‘)

itemDict[key] = value

return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):

ua = UserAgent()

headers = {

‘User-Agent’: ua.random,

}

cookies = self.stringToDict(str(self.get_cookie().strip(‘{|}’)))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

cookies = self.stringToDict(str(self.get_cookie().strip(‘{|}’)))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

settings.py 中的配置:

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

5、录入账号和密码:

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

格式规定(账号—-密码)

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

6、验证:(注意:使用cmd)

python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

本文标题: Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

本文地址: http://www.cppcns.com/jiaoben/python/373587.html

Original: https://blog.csdn.net/weixin_39856589/article/details/113638189
Author: weixin_39856589
Title: python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/792124/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球