一、Python数据分析概述
数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和总结概括的过程. 广义的数据分析包括狭义数据分析和数据挖掘。
狭义的数据分析是指根据数据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有信息,得到特征统计计量结果的过程。
数据挖掘是从大量的、不完全的、有噪声的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。
二、Numpy数值计算基础
Python的array模块不支持多维,numpy提供的存储单一数据类型的多维数组——ndarray可以弥补其不足。
一维:
import numpy as np
arr1 = np.array([1,2,3,4])
print('创建的数组为:\n',arr1)
二维:
arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10])
print('创建的数组为:\n',arr2)
print('数组维度为:',arr2.shape)
print('数组类型为:',arr2.dtype)
print('数组元素个数为:',arr2.size)
print('数组每个元素大小为:',arr2.itemsize)
arange:
print('使用arange函数创建的数组为:\n',np.arange(0,1,0.1))
linspace:
print('使用logspace函数创建的数列为:',np.logspace(0,2,10))
zero:
print('使用zeros函数创建的数组为:\n',np.zeros((2,3)))
eye:
print('使用eye创建的数组为:\n',np.eye(3))
ones:
print('使用ones函数创建元素全为1的数组为:\n',np.ones((5,3)))
类型描述bool布尔类型(True 或者False)inti由所在平台决定精度的整数(一般为int32或者int64)int32整数int64整数float32单精度浮点数(32位)float64双精度浮点数(64位)
类型转换举例;
print(np.float64(42))
print(np.bool(42))
与随机数相关的函数都在random模块中,其中包括了可以生成服从多种概率分布随机数的函数。
print('生成的随机数组为:',np.random.random(100))
print('生成的随机数组为: \n',np.random.rand(10,5))
print('生成的随机数组为: \n',np.random.randn(10,5))
print('生成的随机数组为: ',numpy.random.randint(low, high=None, size=None, dtype='1'))
Original: https://blog.csdn.net/m0_50707858/article/details/121105394
Author: lith__romantic
Title: Python数据分析与应用(一)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/762804/
转载文章受原作者版权保护。转载请注明原作者出处!