1.数据阶段要使用的编译器：jupyter notebook
2.数据阶段：
AI 初级
AI体系： google alphago 深度学习阶段
商业阶段：推荐系统，人脸识别，验证码识别，BI(数据分析)(偏运维)
工业领域：智能驾驶，语义分析，情感分析，目标检测(偏重算法开发)
数学基础：高等数学，概率论，线性代数
python 基本库:numpy pandas ==> 数据分析+人工智能的基础
sklearn ==> 数据挖掘+人工智能的基础（也可以用于建模)
tensorflow ==> 深度学习的框架
可视化工具：Matplotlib seaborn Excel POWERBI Tableau SPSS

python是综合学科：python-web 爬虫数据分析
数据分析岗监控数据给出一些决策建议（商业数据分析模式）

2.Jupyter

shift+tab ==> 查看帮助文档 { help(len) 获取 ? len }
shift+enter ==> 运行 { 或者：ctrl+enter }

3.Ipython

3.1 运行外部的python命令

使用下面的命令运行外部的python文件（默认是当前目录，最好加上绝对路径）：
%run *.py 注意：路径不用加双引号

运行外部的python，相当于把整个文件的资源都加载到jupyter notebook中了，所以py文件里面的所有变量。函数都可以直接使用。

如下所示：

3.2 运行计时

% 表示检测一行代码
%% 表示检测多行代码
time 代码运行一次
timeit 代码运行多次，求平均时间

%time 表示检测一行代码运行一次时间
%timeit 表示检测一行代码运行的平均时间
%%time 表示多行代码运行时间
%%timeit 表示多行代码平均运行时间
短代码建议用第二种，长代码用第一种，因为第二种运行多次耗时太长。

3.3 查看当前会话中所有变量与函数

%who ==> 快速查看当前会话的所有变量与函数名称
%whos ==> 查看当前会话的所有变量与函数名称的详细信息
%who_ls ==> 返回一个字符串列表，里面元素是当前会话的所有变量与函数名称

3.4 执行Linux指令

mac Linux ==> 使用！
windows ==> 使用%

注意：%与指令之间无空格

3.5 更多魔法指令

列出所有的魔法指令：%lsmagic

查看魔法指令的文档：使用？

3.6 Ipython输入输出历史

可使用In/Out调用输入输出历史：

In返回一个字符串列表，里面是所有输入命令的字符串；
Out返回一个含有输出的命令的序号及其输出组成的字典；
两者皆可以通过索引获取元素。

使用下划线表示输出：
“_”表示上一个输出
“_2″表示Out[2]

4.numpy数组基本概念

numpy提供了一种数组类型，高维数组，提供了数据分析的运算基础(业务表一般就是二维）

c ==> 数组的概念:数据类型一致的一个连续的内存空间
python ==> list列表(C语言说:列表其实就是一个指针数组）,列表不要求数据类型一致
numpy ==> 同样是一个【有序】的，【相同数据类型】的集合

numpy设计初衷是用于运算的，所以对数据类型进行统一优化。
注意︰

numpy默认ndarray的所有元素的类型是相同的
如果传进来的列表中包含不同的类型，则统一为同一类型，优先级:str>float>int

5.numpy数组的构造与属性

5.1 numpy的一般构造

array(object，dtype=None，copy=True，order=’K’, subok=False，ndmin=0)

5.2 numpy的常规函数构造

包含以下常见创建方法︰
1) np.ones(shape, dtype=None, order=’C’)
2) np.zeros(shape, dtype=float, order=’C’)
3) np.full(shape, fill_value, dtype=None, order=’C’)
4) np.eye(N, M=None,k=0, dtype=float) 对角线为1其他的位置为0
5) np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
6) np.arange([start, ]stop, [step, ]dtype=None)
7) np.random.randint(low, high=None, size=None, dtype=’)
8)正态分布函数
. np.random.randn(d0, d1，…， dn) 标准正态分布
. np.random.normal() 普通正态分布
9) np.random.random(size=None) 生成0到1的随机数，左闭右开
10)np.random.permutation(n) 生成n个无重复的整数，用于随即生成索引

shape的几种情况：
shape=(m,n) m行n列二维数组
shape=(m) m个元素的一维数组
shape(m,) m个元素的一维数组

shape(m,1) m行1列二维数组 [[1],[3],[5]]
shape(1,m) 1行m列二维数组 [[1,2,3]]

1) np.ones(shape, dtype=None, order=’C’)

2) np.zeros(shape, dtype=float, order=’C’)

3) np.full(shape, fill_value, dtype=None, order=’C’)

4) np.eye(N, M=None,k=0, dtype=float) 对角线为1其他的位置为0

5) np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
等差数列关注生成多少个数据 [start,stop]
6) np.arange([start, ]stop, [step, ]dtype=None)
等差数列关注步长 [start,stop)

7) np.random.randint(low, high=None, size=None, dtype=’)

8)正态分布函数
. np.random.randn(d0, d1，…， dn) 标准正态分布
. np.random.normal() 普通正态分布
9) np.random.random(size=None) 生成0到1的随机数，[0,1)

10)np.random.permutation(n) 生成n个无重复的整数，用于随即生成索引

5.3 numpy必记属性

4个必记参数：

ndim:维度
shape :形状（各维度的长度)
size:总长度
dtype :元素类型

6.numpy的基本操作

6.1 索引

一维与列表完全一致，多维时同理。
二维数组：
num[0] ==>第0行
num[1][2] ==>1行2列（兼容）
num[1,2] ==>1行2列（特有方式）
一维数组：
num[2]
num[[0,1,2] ==>同时访问多个
高级用法：
使用列表下标访问；
使用bool类型访问。
数据翻转：arr[::-1]

6.2 切片

一维与列表完全一致，多维时同理。
所有的切片都是左闭右开区间 [start,end)
不论多少维，每一个维度的切片范围都是用冒号表示，使用逗号分割，最后一个维度可以省略，但是被切片的维度之前的维度不能省。

6.3 变形

使用reshape函数，reshape返回的是一个新数组，原数组不变。
注意：参数是一个tuple，但不写成元组也可以；不可以将参数写成shape=(m,n)，报错。

6.4 级联

级联：就是将两个数组连接。
np.concatenate()级联需要注意的点:
1.级联的参数是列表：一定要加中括号或小括号
2.维度必须相同
3.形状相符
4.【重点】级联的方向默认是shape这个tuple的第一个值所代表的维度方向
5.可通过axis参数改变级联的方向

np.hstack与np.vstack：
水平级联与垂直级联,处理自己，进行维度的变更

6.5 切分

与级联类似，三个函数完成切分工作:

np.split(ary, indices_or_sections, axis=0)
np.vsplit(ary, indices_or_sections)
np.hsplit(ary, indices_or_sections)

indices_or_sections=[n1,n2,…]可以指定切的方法, n1，n2相当于刀，切一刀。

7.numpy的聚合操作

7.1 常见的聚合操作

arr.sum() ==> 求和 arr.max() ==> 求最大
arr.min() ==> 求最小 arr.argmin() ==> 求最小值下标
arr.mean() ==> 求平均值 np.median(arr) ==> 求中位数(注意：不一样)
arr.std() ==> 求标准差 arr.var() ==>求方差
np.percentile(arr,[0.25,0.5,0.75]) ==> 求分位数
arr.all() ==> bool列表里所有值都是True 或者 all(arr)
arr.any() ==> bool列表里有值是True 或者 any(arr)

7.2 广播运算

广播运算，数组中的每一个数都和一个数字进行运算。
【重要】 nd.array广播机制的两条规则：

规则一︰为缺失的维度补
规则二︰假定缺失元素用已有值填充(填充是拿整体填充，不可以只拿一部分，比如2行2列不可以扩充到2行3列只能2行4列或其他)

8.矩阵运算

a*b ==> 对应位置相乘
a.dot(b) ==> 矩阵相乘(一行乘以一列) 或者np.dot(a,b)

9.numpy排序

9.1 快速排序

np.sort()与ndarray.sort()都可以，但有区别:

np.sort()不改变输入
arr.sort()本地处理，不占用空间，但改变输入

np.partition(a,k)
有的时候我们不是对全部数据感兴趣，我们可能只对最小或最大的一部分感兴趣。

当k为正时，我们想要得到最小的k个数
当k为负时，我们想要得到最大的k个数

Original: https://blog.csdn.net/m0_58086930/article/details/125643490
Author: 我行我素，向往自由
Title: Numpy全系列笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/694682/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

安卓手机标定相机IMU外参过程

本文阐述安卓手机标定相机IMU外参过程,包括以下主要流程： 1. 制作标定板2. 单独标定单目相机的外参3. 单独标定IMU的外参4. 相机IMU的联合标定 1.为什么要进行相机标…

人工智能 2023年5月28日
0088
【h5文件读取】h5文件读取——深度学习数据集常用

数据集的常用格式：h5 深度学习搞了很长时间，其中开源的代码中经常用到大型数据集，里面的数据类型是h5格式，这个格式困扰我挺长时间，因为隔离还拿不到实验室的程序，只好硬着头皮再琢磨…

人工智能 2023年6月16日
0083
第三章练习-用卷积提高手写数字识别准确度

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、题目 * Exercise 3 练习3 二、笔者答案 * 1.代码 2.运行截图三、参考答案…

人工智能 2023年5月26日
00104
【自动驾驶】PID实现轨迹跟踪

文章目录参考资料 1. PID控制原理 * 1.1 基本概念 1.2 数字 PID 控制算法 – 1. 位置式PID + python代码实现 2. 增量式PID +…

人工智能 2023年6月23日
0074
激光SLAM框架总结

一、激光SLAM简介基于激光雷达的同时定位与地图构建技术（simultaneous localization and mapping， SLAM）以其准确测量障碍点的角度与距离、…

人工智能 2023年7月26日
0072
Python 股票数据采集并做数据可视化(爬虫 + 数据分析)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月15日
0071
pytorch学习笔记十二：优化器

前言机器学习中的五个步骤：数据 ——> 模型 ——> 损失函数 ——> 优化器 ——> 迭代训练，通过前向传播，得到模型的输出和真实标签之间的差异，也就是损…

人工智能 2023年7月21日
00103
python中列表数据保留2位小数（一维，二维）

直接转： import numpy as np list_2d =[[0.23222,0.331212,0.21398331],[0.345222,0.391212,0.81398…

人工智能 2023年6月16日
0093
超参数调优框架optuna（可配合pytorch）

目录前言一、optuna的使用流程二、结果可视化三、pytorch代码使用optuna 前言在深度学习快速发展的今天，对于不同深度学习模型的超参数优化（hyperpara…

人工智能 2023年7月22日
00103
COCO数据集格式、mask两种存储格式、官方包API详解

文章目录前言 COCO数据集格式 * 总体组织结构 image对象的主要属性： annotation对象的属性主要： pycocotools包中的COCO对象及API * COC…

人工智能 2023年5月26日
0073
pytorch中LSTM参数详解（一张图帮你更好的理解每一个参数）

对LSTM网络的理解对LSTM网络不理解的请看这篇博客，对新手比较友好，也很容易理解，只有理解了LSTM，才知道下面要讲的参数分别对应什么 LSTM参数列表 Pytorch中创建…

人工智能 2023年7月22日
00104
OpenPrompt工具包使用

对工具包的介绍有个疑问比如说positive这个类有好几个单词，那训练的时候到底看哪个？现有模板的一些总结目前的研究的组合方式 Original: https://www.c…

人工智能 2023年6月4日
00123
随便记录一下工作两周的垃圾代码

遍历文件夹 for path,dirnames,filenames in os.walk(r’C:\Users\xufy\Desktop\文件夹\\’): for name in …

人工智能 2023年7月7日
0066
YOLOX训练自己的VOC数据集

文章目录一、下载YOLOX代码二、配置文件 * 修改数据集参数三、开始训练 * 报错1：no model named ‘yolox’ 报错2：No s…

人工智能 2023年7月23日
0084
Python 中的 PIL 库

一、简介 Pillow 是 Python 中较为基础的图像处理库，主要用于图像的基本处理，比如裁剪图像、调整图像大小和图像颜色处理等。与 Pillow 相比，OpenCV 和 S…

人工智能 2023年6月20日
0060
Python数模笔记-StatsModels 统计回归（1）简介

statsmodels（http://www.statsmodels.org）是一个Python库，用于拟合多种统计模型，执行统计测试以及数据探索和可视化。最新版本的文档位于：h…

人工智能 2023年6月18日
00107

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Numpy全系列笔记