这是机器未来的第57篇文章
原文首发地址:https://robotsfutures.blog.csdn.net/article/details/127116651
; 《Python数据科学快速入门系列》快速导航:
- 【Python数据科学快速入门系列 | 01】Numpy初窥——基础概念
- 【Python数据科学快速入门系列 | 02】创建ndarray对象的十多种方法
- 【Python数据科学快速入门系列 | 03】玩转数据摘取:Numpy的索引与切片
- 【Python数据科学快速入门系列 | 04】Numpy四则运算、矩阵运算和广播机制的爱恨情仇
- 【Python数据科学快速入门系列 | 05】常用科学计算函数
- 【Python数据科学快速入门系列 | 06】Matplotlib数据可视化基础入门(一)
- 【Python数据科学快速入门系列 | 07】Matplotlib数据可视化基础入门(二)
- 【Python数据科学快速入门系列 | 08】类别比较图表应用总结
文章目录
写在开始:
- 博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!
- 博主社区:AIoT机器智能, 欢迎加入!
- 专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。
-
面向人群:AI初级学习者
-
概述
本篇文章总结常用的数据关系图表。
数据关系图表强调2个或以上变量的相关性关系。例如机器学习、深度学习时分析特征与标签的相关性分析。数据关系图表又分为数值关系、层次关系和网络关系三种。
; 2. 常用的数据关系图表应用
2.1 散点图
散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。
散点图经常与回归线(就是最准确地贯穿所有点的线)结合使用,归纳分析现有数据以进行预测分析。
对于那些变量之间存在密切关系,但是这些关系又不像数学公式和物理公式那样能够精确表达的,散点图是一种很好的图形工具。但是在分析过程中需要注意,这两个变量之间的相关性并不等同于确定的因果关系,也可能需要考虑其他的影响因素。
在matplotlib中,散点图是通过方法scatter来实现的。
plt.scatter??
`
A scatter plot of y vs. x with varying marker size and/or color.
Parameters~matplotlib.collections.PathCollection
Other Parameters
plot : To plot scatter plots when markers are identical in size and
color.
Notes
Original: https://blog.csdn.net/RobotFutures/article/details/127116651
Author: 机器未来
Title: 【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/618668/
转载文章受原作者版权保护。转载请注明原作者出处!