Python机器学习:使用Pandas进行探索性数据分析 Ⅰ
文章目录
- Python机器学习:使用Pandas进行探索性数据分析 Ⅰ
* - 一、前言
- 二、我的环境
- 三、数据理解
- 四、数据可视化
- 五、回归趋势
- 六、账户之间的相关性
- 七、数据准备
- 八、将字段转换为正确的数据类型
- 九、删除分析字段
- 十、最后我想说
一、前言
数据分析及其预测,在很多领域中都能用到,本期博客,我们来学习一下使用Pandas库对会计业务的数据分析预测并将其可视化。
会计业务的信息量很大,正常的处理起来非常的耗时间,灵活运用Python中的数据分析工具Pandas可以有效的提高处理效率,不管是学计算机的还是学会计学的都可以来学习一下,将其视为一个方便快捷的工具,可以让你事半功倍。
二、我的环境
- 电脑系统:Windows 11
- 语言版本:Python 3.10.4
- 编译器:DataSpell 2022.2
三、数据理解
我们的数据集是一个CSV文件,我们来查看一下:
import pandas as pd
df = pd.read_csv('regression.csv')
df.head()
我们可以看出这个CSV文件包含时间,成本中心,账户有关信息以及金额,我们的目标就是最后的金额分析。
以上是返回前五行数据,我们再返回最后五行数据看看:
df.tail()
从时间上我们可以看出这个CSV文件有总共三年的数据量。
在机器学习中,有一件很重要的事情就是评估数据的质量,我们来查看一下我们的数据有没有任何缺失值:
df.info()
它运行的结果是:
`python
RangeIndex: 4212 entries, 0 to 4211
Data columns (total 7 columns):
Original: https://blog.csdn.net/qq_52417436/article/details/126708036
Author: -北天-
Title: Python机器学习:使用Pandas进行探索性数据分析 Ⅰ
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/751974/
转载文章受原作者版权保护。转载请注明原作者出处!