数据分析师必备的python包

1. numpy

numpy提供大量数值编程工具,可以方便处理向量矩阵等运算。是科学计算方面的利器。

2. scipy

统计就是在做宏观分析的工作。拿到一组数据,分析数据的特征,具体包括样本大小,极值,均值,方差,偏度和峰度,数据的相关系数等。

分布是统计学中最基本的知识。如何指定参数生成分布,一组数据是否符合某种分布(假设检验),分布中的分位,以及认定数据属于某种分布时其对应的参数的最大似然估计(fit)。这些都在 scipy.stats包中提供对应的函数实现。

scipy.optimize

3. pandas

数据通常包含多种类型,例如股票的代码是字符串,收盘价是浮点数,成交量是整数等。pandas是复杂数据类型的利器。pandas最常见的两种数据类型:series和dataframe

series是带索引的一维数组。

而dataframe是将数个series按列合并而成的二维数据结构,单独一列就是一个series。dataframe是以列作为操作基础。

4. matplotlib

这个包用于画图显示数据,尤其是和dataframe数据结构配合,可以直观了解数据信息。

Original: https://blog.csdn.net/allenhsu6/article/details/121788981
Author: little_miya
Title: 数据分析师必备的python包

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/679211/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球