前言
今天带大家采集一个二次元图片网站, 里面漂亮的小姐姐层出不穷,图片的数据量也是比较大的, 来一睹为快吧! !
开发环境介绍:
python 3.6
pycharm
requests
parsel
os
爬虫案例数据采集一般步骤:
- 找数据对应的链接地址
- 代码发送地址的请求
- 数据解析
- 数据保存(本地)
干货主要有:
① 200 多本 Python 电子书(和经典的书籍)应该有
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且可靠的练手项目及源码)
④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
- 首先第一步,找到对应的链接地址
因为是静态网页,所以数据很容易就找到了
- 代码发送地址的请求
response = requests.get(url=request_address, headers=headers)
html_data = response.text
请求一下,看看对不对
- 数据解析
<span class="hljs-attribute">selector = parsel.Selector(html_data) </span>
- 保存数据
<span class="hljs-keyword">with <span class="hljs-keyword">open(f<span class="hljs-string">'img\{pic_title}\{pic_name}', <span class="hljs-keyword">mode=<span class="hljs-string">'wb') <span class="hljs-keyword">as f:
f.write(img_data)
print(<span class="hljs-string">'保存完成:', pic_name)</span></span></span></span></span></span></span>
运行完整代码
Original: https://www.cnblogs.com/sn5200/p/15883788.html
Author: Python可乐的呀
Title: 伤腰的Python爬虫案例,零基础必备实战教程
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/814992/
转载文章受原作者版权保护。转载请注明原作者出处!