# Python 数据分析三剑客 numpy / pandas / matplotlib （numpy篇②）

2023年7月17日上午10:10 • 人工智能 • 阅读 59

接着上一讲

切片是引用

切片在内存中使用的是引用机制。

引用机制意味着，Python并没有为b分配新的空间来存储它的值，而是让b指向了a所分配的内存空间，因此，改变b会改变a的值：

a = np.array([0,1,2,3,4,5])
b = a[2:4]

b[1] = 40
a

而这种现象在列表中并不会出现：

a = [0,1,2,3,4,5]
b = a[1:3]

b[1] = 40
a

这样做的好处在于，对于很大的数组，不用大量复制多余的值，节约了空间。
缺点在于，可能出现改变一个值改变另一个值的情况。

一个解决方法是使用 copy方法产生一个复制，这个复制会申请新的内存：

a = np.array([0,1,2,3,4,5])
b = a[2:4].copy()
b[1] = 10
a

花式索引

切片只能支持连续或者等间隔的切片操作，要想实现任意位置的操作，需要使用花式索引 fancy slicing

一维花式索引

与range函数类似，我们可以使用arange函数来产生等差数组。

a = np.arrage(0,100,10)

index = [1,3,5]
y = a[index]

花式索引需要指定索引位置：还可以使用布尔数组来花式索引：

mask = np.array([0,1,2,3,0,0,0,4,2,0],dtype = "bool")

s = a[mask]

mask 必须是布尔数组，长度必须和数组长度相等。

二维花式索引

对于二维花式索引，我们需要给定行和列的值:
在这里沿用之前的数组：

a = np.array([[0,1,2,3,4,5],[10,11,12,13,14,15],[20,21,22,23,24,25],[30,31,32,33,34,35],[40,41,42,43,44,45],[50,51,52,53,54,55]])
a

# Python 数据分析三剑客 numpy / pandas / matplotlib （numpy篇②）

返回的是一条次对角线上的5个值。

b = a[(0,1,2,3,4),(1,2,3,4,5)]

返回的是最后三行的第1，3，5列:

b = a[3:,(0,2,4)]

也可以使用mask进行索引：

mask = np.array([1,0,1,0,0,1],dtype = bool)
a[mask,2]

与切片不同，花式索引返回的是原对象的一个复制而不是引用

“不完全”索引

只给定索引的时候，返回整行

a[:3]

这个时候也可用花式索引取出2,3,5行

mask = np.array([0,1,1,0,0,1],dtype = bool)
a[mask]

where语句

where（array）
where函数会返回所有非零元素的索引。

一维数组

先看一维的例子：

a = np.array([70,2,30,4,5])

判断数组中的元素是不是大于10：

a > 10

数组中所有大于10的元素的索引位置：

np.where(a>10)

注意到where的返回值是一个元组。返回的是索引位置，索引[1，3]大于10的数

也可以直接用数组操作：

a[a>10]

类型转换

首先是最原始的转换方式：

a = np.array([1.2,6],dtype = float)

asarray函数

a = np.array([1.2,6],dtype = float)
np.asarray(a,dtype = int)

astype方法

a = np.array([1.2,6],dtype = float)
b = a.astype(int)

astype方法返回一个新数组，不改变原数组的值

数组操作

我们以豆瓣10部高分电影为例

电影信息


mv_name=['肖申克的救赎','控方证人','美丽人生','辛德勒名单','阿甘正传','霸王别姬','泰坦尼克号','这个杀手不太冷','教父','海上钢琴师']

mv_num = np.array([1231413,1234221,231122,323423,2131231,232424,4564564,3242341,123123,123124])

mv_score = np.array([9.5,9.8,9.2,9.3,9.5,9.3,9.5,9.3,9.7,9.9])

mv_length = np.array([142,123,234,211,242,122,234,212,123,243])

数组排序

sort函数

np.sort(mv_num)

argsort函数

sss = np.argsort(mv_num)

通过这样做就能很好知道其他的相关信息：

mv_name[sss[0]]

求和

np.sum(mv_num)

最大值

np.max(mv_score)

最小值

np.min(mv_score)

标准差

np.std(mv_num)

多维数组操作

数组形状

a = np.arange(6)
a.shape = 2,3

a.shape

与之相对的方法是reshape，但它不会修改原来数组的值，而是返回一个新的数组

a.reshape(2,3)

转置

a = a.reshape(2,3)

a.T

数组连接

有时我们需要将不同的数组按照一定的顺序连接起来：concatenate（（a0，a1，…，aN），axis=0）

注意，这些数组要用（）包括到一个元组中去。
除了给定的轴外，这些数组其他轴的长度必须是一样的。

x = np.array([[1,2,3,4],[5,6,7,8]])
y = np.array([[51,52,53,54],[65,66,67,68]])

默认沿着第一维进行连接：

z = np.concatenate((x,y))

沿着第二维进行连接：

z = np.concatenate((x,y),axis = 1)

注意到这里x和y的形状是一样的，还可以将它们连接成三维的数组，但是concatenate不能提供这样的功能，不过可以这样:

z = np.array((x,y))

事实上，Numpy提供了分别对应这三种情况的函数：

vstack（竖向连接）

np.vstack((x,y))

hstack（横向连接）

np.hstack((x,y))

dstack（三维连接）

np.dstack((x,y))

numpy内置函数

a = np.array([-1,3,-4,5])

求绝对值

b = np.abs(a)

求指数

b = np.exp(a)

求中值

b = np.median(a)

求累计和

b = np.cumsum(a)

Original: https://blog.csdn.net/rc15680632552/article/details/123495248
Author: 人生苦短我愛Python
Title: # Python 数据分析三剑客 numpy / pandas / matplotlib （numpy篇②）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/698421/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语音特征信号分类—BP神经网络—MATLAB实现

语音特征信号识别是语音识别研究领域中的一个重要方面，一般采用模式匹配的原理解决。语音识别的运算过程为: 首先,待识别语音转化为电信号后输入识别系统,经过预处理后用数学方法提取语音…

人工智能 2023年7月1日
0087
33-Vue之ECharts-仪表盘图

ECharts-仪表盘图 * – + 前言 + 仪表盘的特点 + 仪表盘的基本实现 + 仪表盘的常见效果前言本篇来学习写仪表盘图仪表盘的特点可以更直观的表现出某…

人工智能 2023年7月30日
0052
图像处理基本方法-将BMP图片灰度化-c语言实现

图像处理基本方法-将BMP图片灰度化-c语言实现 c语言实现图片灰度化，主要利用公式Gray = R _0.299 + G_0.587 + B*0.114实现。实现函数为bmpG…

人工智能 2023年6月22日
00107
Spring底层事务原理

Spring事务底层原理一、@EnableTransactionManagement工作原理二、Spring事务基本执行原理三、Spring事务的过程四、Spring事务传…

人工智能 2023年7月29日
0043
openPCdet 实现自定义点云数据集训练

openPCdet自定义数据集训练 * – openPCdet 代码框架 – 实现自定义数据集导入的流程 – 自定义数据集类的编写 openPC…

人工智能 2023年5月26日
0080
论文笔记：E(n) Equivariant Graph Neural Networks

0 介绍本文介绍了一种新模型来学习与旋转、平移、反射和排列等变的图神经网络，称为 E(n)-等变图神经网络 (EGNN)。与现有方法相比，EGNN不需要在中间层中计算昂贵的高阶…

人工智能 2023年7月28日
0070
pyhanlp安装步骤

1. python环境安装anaconda环境，一步到位，集成和管理大量的包 Anaconda | Individual Edition 如果安装anaconda时未直接添加入环…

人工智能 2023年5月28日
0097
java计算机毕业设计人才库构建研究源码+数据库+lw文档+系统

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0069
pytorch 一个最简单的回归预测

回归预测其实就是根据数据找出对应的拟合函数，假设我们需要拟合的函数为，也就是给一个x，可以输出一个x^2。第一步产生训练数据与对应标签：生成的训练数据只有一个特征值，每一个数据…

人工智能 2023年6月16日
0098
《李宏毅2022机器学习》HW1 记录

文章目录任务描述一、特征选择（Feature selection）二、调整网络结构和优化器 * 1. 增加神经元和隐藏层 2. L2正则化及调参任务描述现已成功跑完sam…

人工智能 2023年6月26日
0087
Python数据分析中的训练集、验证集、测试集

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python数据分析中的训练集、验证集、测试集 …

人工智能 2023年7月15日
0055
Google Colab 无敌详细使用教程

目录什么是Google Colab 谷歌云盘（Google Driver）一、使用Colab进行训练 1.数据集的上传 2、预训练权重的上传 3.深度学习网络的上传二、打开C…

人工智能 2023年7月28日
0060
图像分类之机器学习基础厕所级讲解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
0056
论文解读：DETR 《End-to-end object detection with transformers》，ECCV 2020

论文解读：DETR 《End-to-end object detection with transformers》，ECCV 2020 * – 0. 论文基本信息 &#…

人工智能 2023年7月12日
0083
解决印地语数据稀缺的语音识别训练难题【内含数据集】

众所周知，作为世界第二人口大国，印度是世界上增长最快的国家之一，其经济增速令人瞩目。同样，印度的互联网市场也处于快速发展阶段。截至2021年上半年，印度拥有近7亿网民，居世界第二位…

人工智能 2023年5月25日
0072
ORB-SLAM3笔记（编译、踩坑、论文、看代码）

目前基于orb_slam想做的方向提升动态建图精度（ √东西Map就是上不去 KITTI有几个groundtruth官网下架了找不到而且红外相机退化环境下的点线融合数据集h…

人工智能 2023年5月26日
0085

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30