【爬虫+可视化】Python爬取疫情数据，并做可视化展示

2023年5月24日下午11:35 • Python • 阅读 55

知识点

爬虫基本流程
json
requests 爬虫当中发送网络请求
pandas 表格处理 / 保存数据
pyecharts 可视化

开发环境

python 3.8 比较稳定版本解释器发行版 anaconda jupyter notebook 里面写数据分析代码专业性
pycharm 专业代码编辑器按照年份与月份划分版本的

爬虫完整代码

导入模块

import requests      # 发送网络请求模块
import json
import pprint        # 格式化输出模块
import pandas as pd  # 数据分析当中一个非常重要的模块

分析网站

首先找到今天要抓取的目标数据。

[En]

First find the target data to be crawled today.

https://news.qq.com/zt2020/page/feiyan.htm

找到数据所在url

发送请求

url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5&_=1638361138568'
response = requests.get(url, verify=False)

获取数据

json_data = response.json()['data']

解析数据

json_data = json.loads(json_data)
china_data = json_data['areaTree'][0]['children'] # 列表
data_set = []
for i in china_data:
    data_dict = {}
    # 地区名称
    data_dict['province'] = i['name']
    # 新增确认
    data_dict['nowConfirm'] = i['total']['nowConfirm']
    # 死亡人数
    data_dict['dead'] = i['total']['dead']
    # 治愈人数
    data_dict['heal'] = i['total']['heal']
    # 死亡率
    data_dict['deadRate'] = i['total']['deadRate']
    # 治愈率
    data_dict['healRate'] = i['total']['healRate']
    data_set.append(data_dict)

保存数据

df = pd.DataFrame(data_set)
df.to_csv('data.csv')

数据可视化

导入模块

from pyecharts import options as opts
from pyecharts.charts import Bar,Line,Pie,Map,Grid

读取数据

df2 = df.sort_values(by=['nowConfirm'],ascending=False)[:9]
df2

死亡率与治愈率

line = (
    Line()
    .add_xaxis(list(df['province'].values))
    .add_yaxis("治愈率", df['healRate'].values.tolist())
    .add_yaxis("死亡率", df['deadRate'].values.tolist())
    .set_global_opts(
        title_opts=opts.TitleOpts(title="死亡率与治愈率"),

    )
)
line.render_notebook()

各地区确诊人数与死亡人数情况

bar = (
    Bar()
    .add_xaxis(list(df['province'].values)[:6])
    .add_yaxis("死亡", df['dead'].values.tolist()[:6])
    .add_yaxis("治愈", df['heal'].values.tolist()[:6])
    .set_global_opts(
        title_opts=opts.TitleOpts(title="各地区确诊人数与死亡人数情况"),
        datazoom_opts=[opts.DataZoomOpts()],
        )
)
bar.render_notebook()

Original: https://www.cnblogs.com/qshhl/p/15668865.html
Author: 松鼠爱吃饼干
Title: 【爬虫+可视化】Python爬取疫情数据，并做可视化展示

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/510574/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python-csv文件读取(csv,datetime,matplotlib)

1 CSV文件介绍可视化的数据以两种常见格式存储：CSV和JSON。要在文本文件中存储数据，一个简单方式是将数据作为一系列以逗号分隔的值（comma-separated val…

Python 2023年8月31日
0051
Python3.10升级记录

2021.10.4日，Python3.10正式版发布了，为了使用新的match语法，2021.10.8将Python3.7升级到了Python3.10，升级记录如下： 1、官方安装…

Python 2023年9月19日
0041
我的硕士前半生

本篇文章属于随笔类，它可能无法对你起到直接帮助，它只是我这个普通学生一年半以来的一些足迹与思考。本文首发于我的个人博客 Forever Young 我的本科像硕士，有实验室有工位，…

Python 2023年11月5日
0048
Python基于深度学习算法实现图书推荐系统项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景在线推荐系统是许多电子商务网站的事情。推…

Python 2023年10月26日
0048
DAY1 python基础

Python 2023年5月24日
0069
商品管理系统数据库设计–SQL Server

目录友情链接 * 1、学生成绩管理系统数据库设计–MySQL 2、医疗信息管理系统数据库–MySQL 3、邮件管理数据库设计–MySQL 4、…

Python 2023年10月26日
0027
python的第三方包Numpy简介（1）

一、关于Numpy 1.Numpy Numpy是Python用于科学计算的基础包，也是大量Python数学和科学计算包的基础，不少数据处理及分析包都是在Numpy基础上开发的，比如…

Python 2023年8月24日
0050
复现MySQL的索引选择失误以及通过OPTIMIZER_TRACE分析过程

验证环境：MySQL 5.7.39 windows-pc 一、构造数据（生成150万数据）构建一张账户表，带有一级部门id和二级部门id，并且建立有索引。比较典型的业务场景，根据…

Python 2023年10月13日
0027
物联网国赛AIOT智能家居系统部署

前言 8月刚刚结束的物联网国赛中首次出现AIOT部署智能家居系统，由于6月新大陆AIOT平台大更新，新版智能家居部署文档过长，且没有相关更好的教学，特制此文章。注：该文章主要是以…

Python 2023年9月28日
0072
pandas 数据透视表

pandas 数据透视表及逆透视主要参数说明 pd.pivot_table(df,index= [] ,columns= [] ,values = [] , aggfunc={&…

Python 2023年8月18日
0030
Nginx与Gunicorn服务器进行配合

Nginx与Gunicorn服务器进行配合为什么要用Gunicorn? Django不是自带runserver服务器?Flask不是自带Werkzeug吗? 为什么还需要使用Gu…

Python 2023年8月15日
0048
一篇解决 —— 报税系统的分析与解决方案

一篇解决 —— 报税系统的分析与解决方案中国征税税种极为广泛，包括所得税（企业所得税和个人所得税）、间接税（增值税和消费税）、与房地产相关的税（土地增值税、房产税、耕地占用税和城…

Python 2023年10月17日
0041
Python爬虫实战+数据分析+数据可视化（前程无忧招聘信息）

一、爬虫部分爬虫说明：1、本爬虫是以面向对象的方式进行代码架构的2、本爬虫是通过将前程无忧网页转换成移动端来进行求职信息爬取的3、本爬虫爬取的数据存入到MongoDB数据库中4、…

Python 2023年8月14日
0059
敏感词汇工具类sensitive word的使用及详解

简述： 1.平时工作中，只要涉及到用户可以自由发言（博客、文档、论坛），就要考虑内容的敏感性处理,sensitive word工具是一个快速的敏感词过滤工具,基于 DFA 算法实现…

Python 2023年10月11日
0071
JAVA缓存规范 —— 虽迟但到的JCache API与天生不俗的Spring Cache

大家好，又见面了。本文是笔者作为掘金技术社区签约作者的身份输出的缓存专栏系列内容，将会通过系列专题，讲清楚缓存的方方面面。如果感兴趣，欢迎关注以获取后续更新。有诗云&#8221…

Python 2023年10月15日
0056
Django 简介和版本介绍

一、简介官方地址：https://www.djangoproject.com Django 是一个由Python 编写的具有完整架站能力的开源Web框架。使用 Django，只要…

Python 2023年11月1日
0033

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【爬虫+可视化】Python爬取疫情数据，并做可视化展示

导入模块

分析网站

发送请求

获取数据

解析数据

保存数据

导入模块

读取数据

死亡率与治愈率

各地区确诊人数与死亡人数情况

大家都在看