数据分析-numpy2

2023年7月16日上午8:09 • 人工智能 • 阅读 99

文章目录

numpy
*
统计函数
数据类型
随机函数
数组的其他函数

numpy

统计函数

求平均值mean()

m1=np.arange(20).reshape((4,5)

m1.mean()

m1.mean(axis=0)

m1.mean(axis=1)

中位数np.median

ar1=np.array([1,3,5,6,8])
np.median(ar1)

标准差ndarray.std

定义：总体各单位标准值与其平均数离差平方的算术平均数的平方根

ar1=np.array([1,3,5,6,8])
np.std(ar1)

按步骤计算标准差
import math
math.sqrt(np.sum(((ar1-np.mean(ar1))**2)/a.size))

方差ndarray.var()

ar1=np.array([1,3,5,6,8])
ar1.var

最大 ndarray.max()和最小ndarray.min()

最大：
m1.max()
m1.max(axis=0)
m1.max(axis=1)
最小：
m1.min()
求和：
m1.sum()

加权平均数

xiaoming=np.array([80,90,95])
xiaogang=np.array([95,90,80])

weights=np.array([0.2,0.3,0.5])

np.average(xiaoming,weights=weights)
np.average(xiaogang,weights=weights)

变异系数：当需要比较两组数据大小的时候，如果两组数据的测量尺度相差太大，或者数据量纲的不同，直接使用标准差来进行表示比较不合适，此时应该消除尺度和量纲的影响，而变异系数可以做到这一点，它是原始数据 标准差与原始数据平均数的比


stat_info=np.array([
              [110.93,16.46,0.2376,0.0573],
              [-0.13,31.01,0.1188,0.0836],
              [8.94,26.67,0.0565,0.0676],
              [17.24,19.53,0.1512,0.0433],
              [43.86,-10.14,0.097,0.0421],
              [-15.34,-13.04,0.0902,0.0732],
              [-20.82,-23.37,0.0582,0.1091]
])

stat_mean=np.mean(stat_info,axis=0)

stat_std=np.std(stat_info,axis=0)

stat_std/stat_mean

数据类型

将数组类型存储为浮点型
a=np.array([1,2,3,4],dtype=np.float64)

定义结构化数据

随机函数

numpy.random.rand(d0,d1,…,dn)

rand函数根据给定维度生成(0,1)之间的数据，包含0，不包含1 dn表示每个维度返回值为指定维度的array

from matplotlib import pyplot as plt
a=np.random.rand(10000)
print(a)
plt.hist(a)

numpy.random.randn(d0,d1,…,dn)

from matplotlib import pyplot as plt
a=np.random.randn(10000)
print(a)
plt.hist(a)

numpy.random.randint()

numpy.random.randint(low,high=None,size=None,dtype=’1′)
返回随机整数，范围区间在[low,high),包含low,不包含high
参数：low为最小值，high为最大值，size为数组维度大小，dtype为数据类型
high没有填写时，默认生成随机数的范围是[0,low)

numpy.random.sample(size=None)

返回半开区间的随机浮点数[0.0,1.0]

随机种子np.random.seed()

使用相同seed()值，则每次生成的随机数都相同，使得随机数可以预测
但是，只在调用的时候seed()一下并不能使生成的随机数相同，需要每次都调用seed()一下,表示种子相同，从而随机数相同

正态分布numpy.random.normal

数组的其他函数

numpy.resize()

numpy.resize()返回指定形状的新数组
numpy.resize(arr,shape)和ndarray.resize(shape,refcheck=False)区别：
numpy.resize(arr,shape)，有返回值，返回复制内容。如果维度不够，会使用原数组数据补齐。
ndarray.resize(shape,refcheck=False)，修改原数组，不会返回数据，如果维度不够，会使用0补齐

a=np.array([[1,2,3],[4,5,6]])
print('数组a:',a)
print('a数组形状:',a.shape)

b=np.resize(a,(3,3))
a.resize((3,3),refcheck=False)

numpy.append(arr,values,axis=None)

a=np.array([[1,2,3],[4,5,6]])
print(np.append(a,[[7,8,9]],axis=0))
print(np.append(a,[[2,2,2],[7,8,9]],axis=1))

numpy.insert(arr,obj,value,axis)

arr:要输入的数组
obj:表示引值，在该索引值之前插入values值
values：要插入的值
axis：指定的轴。如果未提供，则输入数组会被展开为一维数组

a=np.array([[1,2],[3,4],[5,6]])

print(np.insert(a,3,[11,12]))

print(np.insert(a,1,[11],axis=0)

print(np.insert(a,1,11,axis=1))

numpy.delete(arr,obj,axis)

arr:要输入的数组
obj:整数或者整数数组，表示要被删除数组元素或者子数组
axis:沿着哪条轴删除子数组
注意：不提供axis参数，则输入数组被展开为一维数组

a=np.arange(12).reshape(3,4)

print(a)

print(np.delete(a,5))

print(np.delete(a,1,axis=1))

a=np.array([1,2,3,4,5,6,7,8,9,10])

print(np.delete(a,[1,2,3,4]))

numpy.argwhere()

返回数组中非0元素的索引，若是多维数组则返回行，列索引组成的索引坐标

x=np.arange(6).reshape(2,3)
print(x)

y=np.argwhere(x>1)
print(y,y.shape)

Original: https://blog.csdn.net/weixin_66610130/article/details/126690755
Author: 是皮蛋瘦肉周
Title: 数据分析-numpy2

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/696023/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

柯基数据企业知识图谱落地案例分享

从一开始的Google搜索，到现在的聊天机器人、大数据风控、智能医疗、自适应教育、推荐系统，无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。本文通过分享企业知识图谱落地案例，…

人工智能 2023年6月4日
0094
数字图像处理第四章——频率域滤波

目录 4.1 基本概念 4.1.1 复数 4.1.2 傅立叶级数 4.1.3 冲激及其取样特性 4.1.4 连续变量函数的傅里叶变换 4.1.5 卷积 4.2 取样和取样函数的傅里…

人工智能 2023年6月20日
00117
resnet18实现cifar10分类

实验步骤搭建resnet18网络数据集加载模型训练和改进分析评估 Kaggle提交网络构建实验初期拟采用torchvision中实现的resnet18作为网络结构，为了…

人工智能 2023年7月12日
0055
Swin Transformer Object Detection 目标检测-1——环境搭建详细教程

文章目录 * – + 一、所需软件（包）介绍 + 二、环境安装 + * 0. 版本选择 * 1. VS 2019 安装 * 2. 创建conda 虚拟环境 * &#82…

人工智能 2023年7月6日
0076
张量如何与AI算法中的权重和偏差相关联

人工智能 2024年1月1日
0040
有趣的深度学习2——利用pytorch对数据集进行预处理

有趣的深度学习2——利用pytorch对数据集进行预处理用pytorch对数据集进行预处理 * – 有趣的深度学习2——利用pytorch对数据集进行预处理 &#82…

人工智能 2023年7月22日
0064
收藏 | C语言最常用的贪心算法

01 基本概念贪心算法是指在对问题求解时，总是做出在当前看来是最好的选择。也就是说，不从整体最优上加以考虑，只做出在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优…

人工智能 2023年6月26日
00105
Tensorflow2安装

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月24日
0078
2022 年的 PyTorch 与 TensorFlow

你应该在 2022 年使用 PyTorch 还是 TensorFlow？本指南介绍了 PyTorch 与 TensorFlow 的主要优缺点，以及如何选择正确的框架。 PyTorc…

人工智能 2023年5月25日
00136
猿创征文 | 大学生应该知道的开发工具

文章目录 1 VsCode * 1.1 可以自动生成基础架构 1.2 支持对多行代码操作 1.3 支持对代码进行格式化 2 IntelliJ IDEA * 2.1 代码检错功能和实…

人工智能 2023年6月30日
0085
机器学习强基计划0-3：数据集核心知识串讲，构造方法解析

目录 0 写在前面 1 数据集是什么？ 2 真相与泛化性 3 数据集的分类 4 数据集的构造方法 * 4.1 留出法 4.2 k k k 折交叉验证 4.3 自助法 ; 0 写在前…

人工智能 2023年6月23日
0089
吴恩达《深度学习》笔记汇总

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月29日
0080
RK3399开发板AI人工智能深度学习之TensorFlow 测试

人工智能 2023年5月26日
0073
数据挖掘 | 实验一数据的清洗与预处理

文章目录一、目的与要求二、实验设备与环境三、实验内容 * 数据清洗数据集成数据变换（统一格式并标准化）四、实验小结一、目的与要求 1）了解数据质量问题、掌握常用解决方…

人工智能 2023年6月19日
00108
聚类、缺失处理、特征分析——模型几个重要的处理过程（含案例实操）

在数据建模过程中，尤其是通过线性回归、逻辑回归等传统机器学习算法进行模型训练之前，往往需要对样本数据进行清洗，其中缺失值处理是一种常用方法。根据特征的类别属性与缺失特点，采用合适的…

人工智能 2023年5月31日
0089
海思SDK学习（7）海思媒体处理软件平台MMP(6)视频编码VENC

视频编码 1、概述 VENC模块，即视频编码模块。本模块支持多路实时编码，且每路编码独立，编码协议和编码profile 可以不同。本模块支持视频编码同时，调度Region 模块对编…

人工智能 2023年6月20日
00350

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

数据分析-numpy2

文章目录

统计函数

数据类型

随机函数

数组的其他函数

大家都在看