【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结

这是机器未来的第57篇文章

原文首发地址:https://robotsfutures.blog.csdn.net/article/details/127116651

【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结

; 《Python数据科学快速入门系列》快速导航:

文章目录

写在开始:

  • 博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!
  • 博主社区:AIoT机器智能, 欢迎加入!
  • 专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。
  • 面向人群:AI初级学习者

  • 概述

本篇文章总结常用的数据关系图表。

数据关系图表强调2个或以上变量的相关性关系。例如机器学习、深度学习时分析特征与标签的相关性分析。数据关系图表又分为数值关系、层次关系和网络关系三种。

【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结

; 2. 常用的数据关系图表应用

2.1 散点图

散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。

【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结

散点图经常与回归线(就是最准确地贯穿所有点的线)结合使用,归纳分析现有数据以进行预测分析。

对于那些变量之间存在密切关系,但是这些关系又不像数学公式和物理公式那样能够精确表达的,散点图是一种很好的图形工具。但是在分析过程中需要注意,这两个变量之间的相关性并不等同于确定的因果关系,也可能需要考虑其他的影响因素。

在matplotlib中,散点图是通过方法scatter来实现的。

plt.scatter??

`
A scatter plot of y vs. x with varying marker size and/or color.

Parameters
~matplotlib.collections.PathCollection

Other Parameters
plot : To plot scatter plots when markers are identical in size and
color.

Notes

Original: https://blog.csdn.net/RobotFutures/article/details/127116651
Author: 机器未来
Title: 【Python数据科学快速入门系列 | 09】Matplotlib数据关系图表应用总结

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/618668/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球