【爬虫+可视化】Python爬取疫情数据,并做可视化展示

知识点

  1. 爬虫基本流程
  2. json
  3. requests 爬虫当中 发送网络请求
  4. pandas 表格处理 / 保存数据
  5. pyecharts 可视化

开发环境

  • python 3.8 比较稳定版本 解释器发行版 anaconda jupyter notebook 里面写数据分析代码 专业性
  • pycharm 专业代码编辑器 按照年份与月份划分版本的

爬虫完整代码

导入模块

import requests      # 发送网络请求模块
import json
import pprint        # 格式化输出模块
import pandas as pd  # 数据分析当中一个非常重要的模块

分析网站

首先找到今天要抓取的目标数据。

[En]

First find the target data to be crawled today.

https://news.qq.com/zt2020/page/feiyan.htm

【爬虫+可视化】Python爬取疫情数据,并做可视化展示
找到数据所在url
【爬虫+可视化】Python爬取疫情数据,并做可视化展示
【爬虫+可视化】Python爬取疫情数据,并做可视化展示

发送请求

url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5&_=1638361138568'
response = requests.get(url, verify=False)

获取数据

json_data = response.json()['data']

解析数据

json_data = json.loads(json_data)
china_data = json_data['areaTree'][0]['children'] # 列表
data_set = []
for i in china_data:
    data_dict = {}
    # 地区名称
    data_dict['province'] = i['name']
    # 新增确认
    data_dict['nowConfirm'] = i['total']['nowConfirm']
    # 死亡人数
    data_dict['dead'] = i['total']['dead']
    # 治愈人数
    data_dict['heal'] = i['total']['heal']
    # 死亡率
    data_dict['deadRate'] = i['total']['deadRate']
    # 治愈率
    data_dict['healRate'] = i['total']['healRate']
    data_set.append(data_dict)

保存数据

df = pd.DataFrame(data_set)
df.to_csv('data.csv')

数据可视化

导入模块

from pyecharts import options as opts
from pyecharts.charts import Bar,Line,Pie,Map,Grid

读取数据

df2 = df.sort_values(by=['nowConfirm'],ascending=False)[:9]
df2

死亡率与治愈率

line = (
    Line()
    .add_xaxis(list(df['province'].values))
    .add_yaxis("治愈率", df['healRate'].values.tolist())
    .add_yaxis("死亡率", df['deadRate'].values.tolist())
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡率与治愈率"),

    )
)
line.render_notebook()

各地区确诊人数与死亡人数情况

bar = (
    Bar()
    .add_xaxis(list(df['province'].values)[:6])
    .add_yaxis("死亡", df['dead'].values.tolist()[:6])
    .add_yaxis("治愈", df['heal'].values.tolist()[:6])
    .set_global_opts(
        title_opts=opts.TitleOpts(title="各地区确诊人数与死亡人数情况"),
        datazoom_opts=[opts.DataZoomOpts()],
        )
)
bar.render_notebook()

Original: https://www.cnblogs.com/qshhl/p/15668865.html
Author: 松鼠爱吃饼干
Title: 【爬虫+可视化】Python爬取疫情数据,并做可视化展示

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/510574/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Python-csv文件读取(csv,datetime,matplotlib)

    1 CSV文件介绍 可视化的数据以两种常见格式存储:CSV和JSON。 要在文本文件中存储数据,一个简单方式是将数据作为一系列以逗号分隔的值(comma-separated val…

    Python 2023年8月31日
    051
  • Python3.10升级记录

    2021.10.4日,Python3.10正式版发布了,为了使用新的match语法,2021.10.8将Python3.7升级到了Python3.10,升级记录如下: 1、官方安装…

    Python 2023年9月19日
    041
  • 我的硕士前半生

    本篇文章属于随笔类,它可能无法对你起到直接帮助,它只是我这个普通学生一年半以来的一些足迹与思考。本文首发于我的个人博客 Forever Young 我的本科像硕士,有实验室有工位,…

    Python 2023年11月5日
    048
  • Python基于深度学习算法实现图书推荐系统项目实战

    说明:这是一个机器学习实战项目(附带 数据+代码+文档+视频讲解),如需 数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景 在线推荐系统是许多电子商务网站的事情。推…

    Python 2023年10月26日
    048
  • DAY1 python基础

    Python 2023年5月24日
    069
  • 商品管理系统数据库设计–SQL Server

    目录 友情链接 * 1、学生成绩管理系统数据库设计–MySQL 2、医疗信息管理系统数据库–MySQL 3、邮件管理数据库设计–MySQL 4、…

    Python 2023年10月26日
    027
  • python的第三方包Numpy简介(1)

    一、关于Numpy 1.Numpy Numpy是Python用于科学计算的基础包,也是大量Python数学和科学计算包的基础,不少数据处理及分析包都是在Numpy基础上开发的,比如…

    Python 2023年8月24日
    050
  • 复现MySQL的索引选择失误以及通过OPTIMIZER_TRACE分析过程

    验证环境:MySQL 5.7.39 windows-pc 一、构造数据(生成150万数据) 构建一张账户表,带有一级部门id和二级部门id,并且建立有索引。比较典型的业务场景,根据…

    Python 2023年10月13日
    027
  • 物联网国赛AIOT智能家居系统部署

    前言 8月刚刚结束的物联网国赛中首次出现AIOT部署智能家居系统,由于6月新大陆AIOT平台大更新,新版智能家居部署文档过长,且没有相关更好的教学,特制此文章。 注:该文章主要是以…

    Python 2023年9月28日
    072
  • pandas 数据透视表

    pandas 数据透视表及逆透视 主要参数说明 pd.pivot_table(df,index= [] ,columns= [] ,values = [] , aggfunc={&…

    Python 2023年8月18日
    030
  • Nginx与Gunicorn服务器进行配合

    Nginx与Gunicorn服务器进行配合 为什么要用Gunicorn? Django不是自带runserver服务器?Flask不是自带Werkzeug吗? 为什么还需要使用Gu…

    Python 2023年8月15日
    048
  • 一篇解决 —— 报税系统的分析与解决方案

    一篇解决 —— 报税系统的分析与解决方案 中国征税税种极为广泛,包括所得税(企业所得税和个人所得税)、间接税(增值税和消费税)、与房地产相关的税(土地增值税、房产税、耕地占用税和城…

    Python 2023年10月17日
    041
  • Python爬虫实战+数据分析+数据可视化(前程无忧招聘信息)

    一、爬虫部分 爬虫说明:1、本爬虫是以面向对象的方式进行代码架构的2、本爬虫是通过将前程无忧网页转换成移动端来进行求职信息爬取的3、本爬虫爬取的数据存入到MongoDB数据库中4、…

    Python 2023年8月14日
    059
  • 敏感词汇工具类sensitive word的使用及详解

    简述: 1.平时工作中,只要涉及到用户可以自由发言(博客、文档、论坛),就要考虑内容的敏感性处理,sensitive word工具是一个快速的敏感词过滤工具,基于 DFA 算法实现…

    Python 2023年10月11日
    071
  • JAVA缓存规范 —— 虽迟但到的JCache API与天生不俗的Spring Cache

    大家好,又见面了。 本文是笔者作为掘金技术社区签约作者的身份输出的缓存专栏系列内容,将会通过系列专题,讲清楚缓存的方方面面。如果感兴趣,欢迎关注以获取后续更新。 有诗云&#8221…

    Python 2023年10月15日
    056
  • Django 简介和版本介绍

    一、简介 官方地址:https://www.djangoproject.com Django 是一个由Python 编写的具有完整架站能力的开源Web框架。使用 Django,只要…

    Python 2023年11月1日
    033
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球