python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结

2023年5月24日上午1:15 • Python • 阅读 62

除了从文件加载数据外，另一个数据源是互联网，它每天产生各种不同的数据，可以以多种方式从互联网加载数据。

[En]

In addition to loading data from files, another data source is the Internet, which produces a variety of different data every day and can load data from the Internet in a variety of ways.

一、了解 Web API

Web 应用编程接口（API）自动请求网站的特定信息，再对这些信息进行可视化。每次运行，都会获取最新的数据来生成可视化，因此即便网络上的数据瞬息万变，它呈现的信息也都是最新的。

Web API是网站的一部分，用于与使用非常具体的URL请求特定信息的程序交互。这种请求称为API调用。请求的数据将以易于处理的格式（如JSON或CSV）返回。

GitHub（https://github.com/）上的项目都存储在仓库中，后者包含与项目相关联的一切：代码、项目参与者的信息、问题或bug报告等，编写一个自动下载GitHub上的Python项目的相关信息。

在浏览器中打开：https://api.github.com/search/repositories?q=language:python&sort=stars，可以看到如下内容，

python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结

此调用返回GitHub当前托管了total_count 8884066个Python项目，还有最受欢迎的Python仓库的信息。

其中第一部分（ https://api.github.com/ ）将请求发送到GitHub网站中响应API调用的部分；

第二部分（ search/repositories ）让API搜索GitHub上的所有仓库。

repositories 后面的问号指出我们要传递一个实参。 q 表示查询，而等号让我们能够开始指定
查询（ q= ）。通过使用 language:python ，我们指出只想获取主要语言为Python的仓库的信息。

最后一部分（ &sort=stars ）指定将项目按其获得的星级进行排序。

但我们不能每次通过打开网页的形式来获取数据。但可以通过python中相关库

二、安装 requests

requests是一个很实用的Python HTTP客户端库，专门用于发送HTTP请求，方便编程，编写爬虫和测试服务器响应数据时经常会用到，

Requests主要相关参数有：

r.status_code 响应状态码
r.heards 响应头
r.cookies 响应cookies

r.text 响应文本
r. encoding 当前编码
r. content 以字节形式（二进制）返回

鉴于一直都使用的是anaconda3,可直接打开 anaconda prompt，然后输入命令：pip install –user requests 安装即可。

下面来编写一个程序，执行API调用并处理结果，找出GitHub上星级最高的Python项目，代码如下：

import requests   # 导入模块requests

url='https://api.github.com/search/repositories?q=language:python&sort=stars'#存储API调用的URL
r = requests.get(url)  # 调用get()并将URL传递给它，响应对象存储在变量 r中
print("Status code:",r.status_code) #包含一个名为status_code的属性
response_dict = r.json()   # 使用方法json()将这些信息转换为一个Python字典
print(response_dict.keys())  #打印出字典的key

上述代码分两行打印，运行结果如下：

[En]

The above code is printed on two lines, and the running result is as follows:

csharp;gutter:true; Status code: 200 dict_keys(['total_count', 'incomplete_results', 'items']) <pre><code> 状态码为200，请求成功。响应字典包含三个键： 'total_count'和 'incomplete_results'和 'items' 将API调用返回的信息存储到字典中，就可以利用前面了解的字典的键-值对来研究自己喜欢的信息了。三、整理字典中的信息上述代码response_dict = r.json()实际上已将请求信息转为字典，那查看一下字典里有些什么内容。从浏览器中打开的内容可以看到，返回的内容是词典包含词典。<details><summary>*[En]*</summary>*From the content opened in the browser, you can see that the returned content is that the dictionary contains the dictionary.*</details> （items是作为最上那个大括号中的key，对应的值，是由多个字典组成的字典列表，'id'，'node_id'，'name'等也是items列表中第一子字典的key，见红色方框部分，列表字典等相互嵌套，好好分析一下）。 1）先看一下与 'total_count'关联的值 </code></pre> print("Total repositories:", response_dict['total_count']) <pre><code> 2）items本身是一个字典，'id'，'node_id'，'name'等均是key，后面对应的都是值，可以查一下有多少个key </code></pre> repo_dicts = response_dict['items'] #建一个变量字典repo_dicts，将items字典列表存储在 repo_dicts print("Repositories returned:", len(repo_dicts))# 打 repo_dicts的长度，获得item字典的长度信息 <pre><code> 3）查看第一个item的详细信息，并打印出所有key </code></pre> repo_dict = repo_dicts[0] #提取了repo_dicts中的第一个字典 print("\nKeys:", len(repo_dict)) #打印这个字典包含的键数 print("\n") for key in repo_dict.keys():#打印这个字典的所有键 print(key) <pre><code> 整体运行结果(下面图片的白色部分由浏览器打开)：<details><summary>*[En]*</summary>*The overall running result (the white part of the image below is opened by the browser):*</details> ![python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结](https://johngo-pic.oss-cn-beijing.aliyuncs.com/articles/20230523/2826255-20220430104730418-1100426298.png) 思考一下，为什么图中的Total repositories一个是9037884，另一个为9145790，两者不一致？有了key，就很容易查询到相关的值了（当然这里都是字符串，如果是数字型的就能可视化）四，数字可视化通过浏览器打开页面，会发现"forks": 32471, "open_issues": 305, "watchers": 177777等有相关数据，于是，可以通过对应的key，将相关数据整合成一个数据列表，然后显示出来，比如可视化wathers </code></pre> count=0 watchers, counts= [], [] for repo_dict in repo_dicts: watchers.append(repo_dict['watchers']) count += 1 counts.append(count) plt.bar(counts,watchers, label="watchers", color='#ff2204') plt.legend() plt.show()

运行结果：

第五，数据可视化小结：

[En]

Fifth, a small summary of data visualization:

matplotlib中数据可视化的方法主要就是调用pyplot接口，再直接调用对象的建立方法，在方法中对该对象进行相应的属性设置，所以掌握这种方法的核心就在于掌握每种对象的建立方法和具体参数设置。Python数据可视化的难处在于掌握参数的设置，内置的参数虽然很多，但一般都用不上（可以留着慢慢钻研），将用得上的参数和参数值几何整理下来，做到这样，对于Python的可视化学习暂时足矣。剩下的时间该去学习其他更为有用的！

简而化之，

曲线图 plt.plot(squares, linewidth=5) 只需要提供一组数据即可
散点图 plt.scatter(x, y,c=’r’,edgecolor=’none’,s=100) ，x,y分别为x轴，y轴坐标位置，x,y对应
柱图 plt.bar(x,y, label=”Test one”, color=’r’) x为x轴位置，y为值，x如为数列,则y对应相同长度
柱图 plt.hist(list, bins, histtype=’bar’, rwidth=0.8,color=’r’) bins为柱图划分范围，表现在x轴上，list为数列，显示在y 轴
饼图 plt.pie(slices) slices 为一数列
堆叠图 plt.stackplot(days, times,labels=labellist,colors=colorlist) days为一维数列，times为一维或多维数列，每一维数列元素个数与days一样。

Original: https://www.cnblogs.com/codingchen/p/16205862.html
Author: PursuitingPeak
Title: python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/499698/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【科研分享】Matplotlib 绘制热力图（heatmap）进行实验结果分析

Matplotlib 绘制热力图（heatmap）进行实验结果分析写论文的时候又碰到了新的需求，为了呈现实验结果，这次需要做一个分析两个超参的图，搜了半天发现还是热力图最合适，但…

Python 2023年8月30日
0061
Python爬虫：爬取华为应用市场全部app信息

先不着急写程序，先对网站进行分析目标网址为：https://appgallery.huawei.com/#/Apps 抓取目标为：app名称包名和开发公司名 F12检查发现为…

Python 2023年11月2日
00105
手把手教你运行YOLOv6（超详细）

YOLOv6 是美团视觉智能部研发的一款目标检测框架，致力于工业应用。本框架同时专注于检测的精度和推理效率，在工业界常用的尺寸模型中：YOLOv6-nano 在 COCO 上精度可…

Python 2023年9月26日
0069
数据分析05

pandas Series和DataFrame * Series DataFrame – DataFrame接收数据 DataFrame的描述信息 DataFrame的…

Python 2023年8月21日
0063
SSTI模板注入

SSTI模板注入 1.SSTI简介 SSTI 就是服务器端模板注入（Server-Side Template Injection）当前使用的一些框架，比如python的fla…

Python 2023年8月13日
0061
01 Python数据可视化：时间序列可视化简明教程

; 一、效果相比网上能搜索到的一些讲解时间序列可视化的文章，结果更精美！！二、时间序列时间序列（或称动态数列）是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。…

Python 2023年9月1日
0052
全网最全——50题matplotlib从入门到精通——搞定数据分析

强烈推荐！！！！！！建议直接点赞收藏，方便接下来使用。 Matplotlib 是 Python 的绘图库。它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案…

Python 2023年9月5日
0052
Python圣诞树

最近在各大社交平台看到好多圣诞树，看到大佬们画的圣诞树一个比一个精致，我也特别想尝试画一棵特别的圣诞树。下面是我画的一棵简易的圣诞树，虽然和网络上大佬们的圣诞树相比不是很精致，但是…

Python 2023年10月8日
0029
情绪识别数据集汇总心电相关and申请方法详细描述呕心沥血之作全网唯一 AMIGOS ASCERTAIN CLAS DECAF DREAMER MANHOB-HCI MPED SWELL

心电信号情绪识别数据集针对情绪识别的任务，在学习了一定的代码知识之后，摆在面前最大的问题就是如何寻找并申请使用数据集，这里我找到了9个情绪识别相关的数据集，由于我的课题原因，所以…

Python 2023年10月26日
0043
C盘满了，清理C盘常用步骤！

真正的深度清理c盘放心，大胆的删除！第一步删除临时文件 1.win+R调出命令框2.输入%temp% 点击确定 3.这里面的文件都是我们在运行软件时所产生的的临时文件，几乎每…

Python 2023年10月27日
0032
利用python在剪贴板上读取/写入数据

读取剪贴板上的数据先给大家介绍 pandas.read_clipboard，从剪贴板读取文本并传递到Read_csv。 pandas.read_clipboard(sep=’\\…

Python 2023年8月18日
0067
<看漫画学Python：有趣、有料、好玩、好用：全彩版>PDF高清版免费试读

404. 抱歉，您访问的资源不存在。可能是URL不正确，或者对应的内容已经被删除，或者处于隐私状态。 [En] It may be that the URL is incorre…

Python 2023年5月23日
0065
python数据分析与展示（一）：numpy库

目录简介 1. ndarray数组的创建 * （1）从python中的列表、元组等类型创建ndarray数组（2）使用numpy中的函数创建ndarray数组。（3）使用nu…

Python 2023年8月29日
0042
【JS 逆向百例】W店UA，OB反混淆，抓包替换CORS跨域错误分析

关注微信公众号：K哥爬虫，持续分享爬虫进阶、JS/安卓逆向等技术干货！声明本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，…

Python 2023年5月24日
0080
Python eval()和exec()函数

Python eval()和exec()函数 eval() 和 exec() 函数都属于 Python 的内置函数。eval() 和 exec() 函数的功能是相似的，都可以执行一…

Python 2023年8月11日
0051
Lombok好用是好用，就是容易踩坑，这份避坑指南请查收

序言各位好啊，我是会编程的蜗牛，作为java开发者，我们平常在开发过程中，总是希望能够尽量少敲代码。这一方面，当然是为了偷懒，另一方面，当然也是为了代码看起来更加简洁一点，不断往…

Python 2023年10月19日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结

大家都在看