【Python】numpy矩阵运算大全

2023年7月3日下午11:08 • 人工智能 • 阅读 57

文章目录

前言
0 遇事不决，先查官网，查着查着就查熟了
1 矩阵运算及其必要性
2 矩阵的创建
*
2.1 普通矩阵
2.2 特殊矩阵
3 矩阵的索引
*
3.1 str, list, tupple的索引
3.2 numpy索引
4 矩阵的运算
*
4.1 通用函数与广播机制
4.3 矩阵乘法
4.4 矩阵求逆
4.5 矩阵转置
4.6 向量合并
4.7 形状变换
4.8 方阵的行列式和秩
4.9 方阵的迹
4.10 解线性方程
5 使用总结
*
5.1 获取numpy数组的大小
5.2 统计数组中元素出现次数
5.3 拷贝与视图
5.4 用列表给一个元素赋值 //2022.11.12
5.5 numpy数据类型——dtype
5.6 利用numpy生成含有具体比例的0和1数组
5.7 获取满足条件的数组索引值 //2022.11.20

前言

因为课程需要，第一次这么彻底地接触numpy。虽闻名已久，但是真正使用numpy才感受到它的强大，发现它尤其适合 数据分析与处理。这里根据自己的使用经验简单总结一下numpy在矩阵运算中的应用，之后也会根据自己的实践经历不断更新。

0 遇事不决，先查官网，查着查着就查熟了

numpy中文官网：https://www.numpy.org.cn/reference/
*numpy英文官网：https://numpy.org/doc/stable/index.html

中文官网主要用于查看相关概念，不建议查某个函数的用法，因为它不支持检索；查函数的使用方法建议参考英文官网（API Reference）。

补充教程：numpy速查手册

1 矩阵运算及其必要性

所谓的数据处理，其本质大都可以归为矩阵运算。因为需要处理的数据大都是矩阵或向量的形式，因此个人认为一个工具适不适合做数据处理，一个重要的指标的就是支不支持矩阵运算，因为如果没有矩阵运算，循环去处理一大堆数据势必会造成运行过长的问题。而这也是为什么很多人会推荐在使用python处理数据的时候不要用它自带的list，而要用numpy。
一般提到矩阵运算，我们首先想到的就是 MATLAB（因为我是先接触的MATLAB~~），因此本文想对标MATLAB中的语法和使用来 对比学习 python中的numpy库。

如果对MATLAB中矩阵运算不熟悉的同学可以看一下我之前的一篇博客。

意外发现其实numpy官网也有一个专门的教程来给熟悉MATLAB的开发人员看的，链接在这里。

2 矩阵的创建

2.1 普通矩阵

numpy中创建矩阵的方式非常单一，一般就是使用 np.array：

import numpy as np
A = np.array([1,2,3])

B = np.array(list_b)

如果要创建二维甚至多维矩阵，则可以利用中括号分隔，如下所示：

import numpy as np
C = np.array([[1,2,3],
            [2,3,4]])

即 中括号是分隔维度。
其实， array函数内部的参数可以非常复杂，具体可以看看官网。但是一般来说，最多就是再指定数组中元素的数据类型：

>>> np.array([1, 2, 3], dtype=complex)
array([ 1.+0.j,  2.+0.j,  3.+0.j])

此外，还需要注意的是，使用 np.array 创建的矩阵其 数据类型 为 np.ndarray ，这个在类型注解时需要注意。

对比MATLAB：
在MATLAB中，创建矩阵是通过空格或逗号来区分同一行的不同元素，用分号来区分不同行，如果创建高维矩阵（>2）不能简单地套中括号，而应该使用专门的函数来进行创建。

2.2 特殊矩阵

和MATLAB一样，numpy也支持创建一些特殊矩阵：

零矩阵： np.zeros()
单位矩阵： np.eye()

3 矩阵的索引

python中的数据索引，不同的数据类型有不同的运算符。

3.1 str, list, tupple的索引

_ 参考链接_

对这些python自带的数据类型，索引数据时除了单独索引某个数据外，剩下的就只需要了解 冒号运算符即可。
冒号运算符的固定结构就是 [start : stop : step]，先来看几个例子理解一下。

再来总结一下上面的规律：上面的表达式 [start : stop : step]当中有三个变量，其实可以把它们都视为函数的参数，且都含有默认值：
其中 step参数默认值就是1；
start参数的默认值则为0，即整个序列的起点；
而 stop参数默认则为序列的终点。
除此之外， step参数最为特殊，即它可以为负值，相当于将其输出的序列顺序反过来，其间隔仍然为 step的绝对值。而且，如果 step参数取默认值，除不写该参数外，第二个冒号也可以省略。

; 3.2 numpy索引

对于numpy的数组，其索引方式更加丰富。除了具有以上所有的索引方式外，numpy还多出一些索引方式，这里简单总结为三点：

逗号运算符
如果需要索引的数组为一个二维及以上的数组，如果是python自带的数据类型，只能是使用多个中括号的方式，但是对于numpy的数组，还可以采用逗号运算符，用来 区分维度。如下所示。
省略号运算符及 冒号运算符
如果要取二维数组的某一行或某一列时，就涉及到需要取一整个维度的问题，可以采用省略号或冒号来实现，如下所示。
列表索引（花式索引）
对于numpy数组来说，除了使用上述的特殊符号外，还可以传入特定的向量，如下所示。

换一种角度来看，其实上面传递的都可以视为一个列表，只是不是特别明显罢了。

对比MATLAB：
在MATLAB中，矩阵的索引是通过 圆括号来实现的，支持 逗号运算符和 花式索引，对于冒号运算符，其结构为 [start : step : stop]，如果要反序，除 step赋值为负数外，还需要将 start和 stop交换顺序。而且MATLAB当中有一个 end的宏变量，指定某一维的末尾。

4 矩阵的运算

4.1 通用函数与广播机制

在学习numpy中矩阵运算规律前，最好要先了解一下numpy中的 通用函数与 广播机制。这也是贯穿numpy矩阵运算所有的重要内容。
所谓 通用函数，是指能够同时对元素内所有元素逐个进行运算的函数。numpy当中几乎所有的计算函数都是通用函数，具体有哪些内容可以参考这篇博客。
使用通用函数有一个非常大的好处就是 本来需要循环遍历的列表可以一次性传入函数，大大节约了运算时间，此即 向量化的思想。
而所谓 广播机制，个人认为可以从两方面来理解。

对于需要传入单个参数的函数（f(x)）来说，如果传入的是多个”单个参数”组成的列表（[x1,x2,…]），那么函数将逐个取值并代入计算，最后返回值也将是原来输出值组成的列表（[f1,f2,…]）。
对于算术运算符来说，如f(x1, x2) = x1 + x2，如果传入的参数维度不一致，那么函数会通过广播机制将输入的参数的维度变为一致。

这里第一种情形比较好理解，关键在于理解第二种。需要明确的是，广播机制并适用于传入任意维度的参数，并不是简单粗暴地取公倍数。常见的有下面这4种类型。（ m*n表示m行n列，左边为A，右边为B）

m*n + m*1 = m*n ：相当于A的每一行的每一个数都加上B对应行的那个离散点；
m*n + 1*n = m*n：相当于A的每一行都和B相加；
m*n + 1*1 = m*n：相当于A的每个元素都加上B这个离散点；
1*n + m*1 = m*n：相当于A的每一列都需要加上B这一行。

总结来看， 两个向量能够应用广播机制的要求是在至少存在某一维，要么两个数值相等，要么有一个值为1
以上是从矩阵的角度来理解，还可以考虑从列表的角度来理解。即把所有的参数都理解为列表。对于二维数组，可以理解为 列表的列表。两个列表相加时，如果维度不同，维度高的需要先降维拆分，直到可以计算为止。如果发现即使降维拆分也无法满足可以计算的要求，则程序报错。

对比MATLAB：
在MATLAB中，矩阵加减法也支持广播机制。

4.3 矩阵乘法

关于矩阵乘法，有两个概念很有意思，叫做 矩阵叉乘和 矩阵点乘。所谓叉乘就是一般的矩阵乘法，即 前一个矩阵的列数要等于后一个矩阵的行数；而所谓矩阵点乘就是矩阵中每个对应元素相乘，要求 两个矩阵同型，乘出来的矩阵大小不变。考虑到这两种运算非常常见，这里做了一个表，来对比python和MATLAB

–PythonMATLAB矩阵乘法（叉乘） np.dot(A, B) A*B

矩阵点乘（对应元素相乘） A*B

or np.multiply(A,B) A.*B

4.4 矩阵求逆

python： np.linalg.inv(A)

MATLAB: inv(A)

; 4.5 矩阵转置

对numpy的数组，想要实现转置非常简单，直接在矩阵的后面加上 .T即可。示例如下：

4.6 向量合并

在进行数据处理时，经常会遇到一种需求那就是将多个列表合并成为一个矩阵。
先来看看python中自带的列表是怎么操作的。对于 list，如果想要合并成为一个大的列表，可以采用 +或 extend函数，如下所示。

list的加号运算符本质就是调用 extend函数

如果想要合成为一个矩阵，即 列表的列表，也非常简单，直接用中括号连接即可。如下所示。

除此之外，还可以使用 append函数实现，如下所示。

需要注意的是，这里的 append函数实现的是在前面的list后面直接加个逗号，再加上括号内的列表，后加入的列表会作为前一个列表的元素， 注意这点和下面的 np.append 之间的区别！

所以使用时最开始都是一个空列表，然后不断append。

此外，还需要注意的是， append 和 extend 函数是修改列表本身，没有返回值！所以不能直接 print(x.append(1)) ，因为得到的一定是 Node ！

再来看看numpy是怎么实现的。

除此之外，还可以使用其自带的 vstack和 hstack函数来构建矩阵。

这里需要注意的是， hstack和 vstack函数只能叠加 同维度的向量或矩阵，比如 x = [[1,2]]和 y=[3,4]就不能进行叠加，因为 x的shape是 (1,2)，而 y的shape是 (2,)
遇到这种问题可以通过调用 reshape函数调整维度。

; 4.7 形状变换

在numpy中，如果想要只改变矩阵的形状而不改变数据时，可以使用 reshape函数。这里有两种使用方式：

import numpy as np
s = np.array([1,2,3,4,5,6])

np.reshape(s,(3,2))

s.reshape(2,3)

值得一提的是，第二种直接修改的方式在传参时，是支持解包的，即可以传 (2,3)，也可以传 2,3，非常方便。

补充教程：python 中 numpy 模块的 size,shape, len的用法

4.8 方阵的行列式和秩

在numpy中也可以求方阵的行列式和秩，其函数包含在其线性代数库 linalg中，使用方式如下图所示。

; 4.9 方阵的迹

所谓方阵的迹，是指主对角线元素之和，在numpy中使用方式如下所示。

4.10 解线性方程

在numpy中还可以解线性方程，对于形式如A X = b AX=b A X =b的线性方程，使用numpy解方程的方式如下所示。

; 5 使用总结

5.1 获取numpy数组的大小

获取numpy数组的大小一般有两个函数： shape和 size，其中 size返回数组的 元素个数， shape返回数组的维度，是一个元组。如果是一维的向量，返回的是 (n, )，其中 n为向量的长度。示例如下所示。

如果要将数组降维，一般采用 flatten和 ravel函数，二者作用相同，区别只在于是否拷贝。其中 flatten拷贝， ravel不拷贝。

; 5.2 统计数组中元素出现次数

在计算信息熵时，常常需要统计数组中元素的出现次数。对于一般的python中的list，如果需要统计数组中各个元素出现次数，可以采用先将list转换为set，然后遍历整个list，如下代码所示。

uniqueValue = set(Value)
uniqueNum = len(uniqueValue)
Dict = dict(zip(uniqueValue,np.zeros(uniqueNum, dtype=int)))
for item in Value:
    Dict[item] += 1

这里利用了 zip函数将两个列表构建成为一个字典

但是在numpy中，使用相对简单：

unique_values = np.unique(a)
unique_values, indices_list = np.unique(a, return_index=True)
unique_values, occurrence_count = np.unique(a, return_counts=True)

_ 参考链接_

此外，对于非负整数的情况，还可以使用 bincount函数，具体可以参考官方文档

5.3 拷贝与视图

先来看看官网的解释：

总结：

取的是 view:
直接创建 view()
简单的赋值
普通的下标索引
调用reshape函数，向量本身并不修改，其返回值为形状改变后的数组
取的是 copy：
直接创建 copy()
花式索引（传入一个列表的情况）
含有返回值的特定函数

; 5.4 用列表给一个元素赋值 //2022.11.12

这是最近遇到的一个问题，先看代码：

从例子中我们可以看出，当 用列表给一个元素赋值时，如果数据类型是数字类型（int, float等），numpy会自动去掉外面的括号，而如果是其他的数据类型，则必须添加索引，否则会报错 setting an array element with a sequence，即用一个列表给数组元素赋值。

5.5 numpy数据类型——dtype

numpy中大部分返回一个 ndarray类型数组的函数一般都会有一个参数 dtype，它的作用就是指定输出数组中数据的类型（格式），其默认值大部分是 float，这也是为什么用 zeros函数建立的数组中数据都带 .。

定义一种数据类型——np.dtype()

import numpy as np
a = np.dtype(int)
print(a)

获取数据类型——a.dtype
要求 a是一个numpy数组。如果直接用 type(a)得到的是数组a的数据类型，就是 ndarray

import numpy as np
a = np.zeros((1,3))
print(a.dtype)
print(type(a))

改变数据类型——a.astype()
同样要求 a是一个numpy数组

import numpy as np
a = np.zeros((1,3))
b = a.astype(int)
print(b.dtype)

数据类型的简写形式
dtype支持简写格式的数据类型，由一个字母加上数字组成，如 'i1'就代表 int8，其数字代表 字节数。常用的字符如下所示。 _ 参考链接_

'b'：布尔值
'i'：符号整数
'u'：无符号整数
'f'：浮点
'c'：复数浮点
'm'：时间间隔
'M'：日期时间
'O'：Python 对象
'S', 'a'：字节串
'U'：Unicode
'V'：原始数据(void)

结构化数据类型（structured datatype）
也叫自建类型，它适用于读取每个个体（每行数据）中的元素数据类型不同的情况，就像是一个结构体，杂糅了多种数据类型，对于这种问题，就可以自己建立一个结构化数据类型来适配各个元素的数据类型。 _ 官网手册链接_

>>> x = np.array([('Rex', 9, 81.0), ('Fido', 3, 27.0)],
             dtype=[('name', 'U10'), ('age', 'i4'), ('weight', 'f4')])
>>> x
array([('Rex', 9, 81.), ('Fido', 3, 27.)],
      dtype=[('name', '), ('age', '), ('weight', ')])

可以发现，数组中的每个元素都是一个结构体（tupple），然后每个结构体中有多个元素，对应不同的数据类型，因此，这个结构体的数据类型是一个列表，其元素个数应与结构体中元素个数相同，然后列表中每个元素的结构都是 (name, datatype)，其中，name可自定义，datatype一般用上面提到的简写形式。
这种结构化数组的一个重要作用是读取一些格式比较复杂的文本文件，即同时包含了字符串和数据。

5.6 利用numpy生成含有具体比例的0和1数组

其中 shuffle函数能够实现随机打乱一个数组，从而可以实现固定比例随机抽取的效果。

; 5.7 获取满足条件的数组索引值 //2022.11.20

最近遇到一个需求： 提取出一个矩阵中最后一列为某个特定值的行。如果用循环解决就太麻烦了，发现numpy自带了这个功能，即提供两个函数： np.where和 np.argwhere，可以通过看下面的例子来了解这两个函数的作用。 _ 参考链接_

Original: https://blog.csdn.net/ZHOU_YONG915/article/details/127265555
Author: 记录无知岁月
Title: 【Python】numpy矩阵运算大全

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/668516/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

columns pandas 修改_Pandas 3：如何修改columns的名称

DataFrame有一个重要的属性——columns，也就是数据集的列名。先前提到过，我们可以在导入数据的时候设置names参数，也可以在导入数据之后设置该数据集的columns属…

人工智能 2023年7月8日
0098
OpenCV C++案例实战二十四《多目标匹配》

OpenCV C++案例实战二十四《多目标匹配》前言一、图像预处理二、单目标匹配三、多目标匹配 * 1、效果显示四、结果显示 * 1、效果显示五、源码总结前言 …

人工智能 2023年7月19日
0066
模型评估方法：ROC曲线与KS曲线

本文代码及数据集来自《Python大数据分析与机器学习商业案例实战》对于二分类模型来说，主流的评估方法有ROC曲线和KS曲线两种。一、ROC曲线如果把假警报率理解为代价的话，…

人工智能 2023年6月11日
0056
克隆你的声音，可能只需要5秒钟：MockingBird实现AI拟声 (详解)

克隆你的声音，可能只需要5秒钟：MockingBird实现AI拟声 0. 引 1. 背景 2. 环境搭建 * 2.1 安装pytorch 2.2 安装ffmpeg 2.3 下载Mo…

人工智能 2023年6月23日
00107
cuda11.6配置torch环境（运行yolov5项目）

cuda11.6配置torch环境（运行yolov5项目）从配置环境到运行项目 * 安装Anaconda的安装 cuda（敲重点）下载torch（再次敲重点）从配置环境到运行…

人工智能 2023年7月22日
0066
强化学习——强化学习概述

文章目录 1. 强化学习 2. 序列决策（Sequential decision making） 3. 动作空间 4. 智能体的组成和类型 * 4.1 策略 – 问题：…

人工智能 2023年7月13日
00113
行列式与矩阵分类

行列式分类（一个数值）—行列地位等同定义：n*n个数值，按n行n列排值=符号为-1的逆序数次方的不同行不同列的数值相乘累加和。 1.一般行列式如爪形，行和相等型等…

人工智能 2023年7月2日
0065
数据挖掘实验-Rstudio

数据挖掘实验-Rstudio 日期:22/4/29 Ps.孩子下载了Rstudio，打算有关R语言的实验都在Rstudio里做。任务一：数据采集、抽取、预处理例一：chengj…

人工智能 2023年7月15日
0063
字符验证码识别干扰线处理

Python的 PIL 库 python imaging library是Python平台的图像处理标准库，我们在图像处理时不仅可以使用 opencv， PIL也是可以的。 fro…

人工智能 2023年7月20日
0079
学习笔记——tensorflow1.14.0环境安装（win10）

选择win 64位下载即可。下载后exe安装，可能需要注意的是会询问你是否添加到环境变量中，可以选择不添加，以后开Anaconda可以用开始里面的Anaconda Prompt打开…

人工智能 2023年5月25日
0091
【CV】SwinIR：使用 Swin Transformer 进行图像恢复

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月17日
0085
利用VGG16卷积神经网络模型数据做五种图片检测

把文件vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5放入C:\Users\DELL.keras\models目录下，本文采用VG…

人工智能 2023年5月25日
0085
ROC和AUC

ROC概念在信号检测理论中，接收者操作特征曲线，或者叫ROC曲线（Receiver operating characteristic curve），用于选择最佳的信号侦测模型、舍…

人工智能 2023年7月1日
0075
Python 数据分析 —— Matplotlib ②

文章目录前提工作 twinx() —— 双轴图（折线图＋柱状图）的绘制 plt.scatter() —— 散点图的绘制 plt.boxplot() —— 箱形图的绘制 seabo…

人工智能 2023年6月11日
0082
深度学习与自然语言处理第二次作业——EM算法解决硬币问题

深度学习与自然语言处理第二次作业——EM算法解决硬币问题利用EM算法解决三类硬币抛掷问题文章目录深度学习与自然语言处理第二次作业——EM算法解决硬币问题一、解题背景二、解…

人工智能 2023年5月28日
0068
NeRF神经辐射场学习笔记（十）— BungeeNeRF（CityNeRF）实现以及代码注释

NeRF神经辐射场学习笔记（十）— BungeeNeRF（CityNeRF）实现以及代码注释声明准备工作运行测试代码解读 * train()主体框架： BungeeNeRF…

人工智能 2023年6月17日
00119

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31