伤腰的Python爬虫案例,零基础必备实战教程

前言

今天带大家采集一个二次元图片网站, 里面漂亮的小姐姐层出不穷,图片的数据量也是比较大的, 来一睹为快吧! !

开发环境介绍:

python 3.6
pycharm
requests
parsel
os

爬虫案例数据采集一般步骤:

  1. 找数据对应的链接地址
  2. 代码发送地址的请求
  3. 数据解析
  4. 数据保存(本地)

干货主要有:

① 200 多本 Python 电子书(和经典的书籍)应该有

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且可靠的练手项目及源码)

④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)

伤腰的Python爬虫案例,零基础必备实战教程
  1. 首先第一步,找到对应的链接地址

因为是静态网页,所以数据很容易就找到了

  1. 代码发送地址的请求
response = requests.get(url=request_address, headers=headers)
html_data = response.text

请求一下,看看对不对

  1. 数据解析
<span class="hljs-attribute">selector = parsel.Selector(html_data)  </span>
  1. 保存数据
<span class="hljs-keyword">with <span class="hljs-keyword">open(f<span class="hljs-string">'img\{pic_title}\{pic_name}', <span class="hljs-keyword">mode=<span class="hljs-string">'wb') <span class="hljs-keyword">as f:
    f.write(img_data)
    print(<span class="hljs-string">'&#x4FDD;&#x5B58;&#x5B8C;&#x6210;:', pic_name)</span></span></span></span></span></span></span>

运行完整代码

Original: https://www.cnblogs.com/sn5200/p/15883788.html
Author: Python可乐的呀
Title: 伤腰的Python爬虫案例,零基础必备实战教程

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/814992/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球