python数据分析基础之Numpy库详解（一）

2023年7月17日下午4:24 • 人工智能 • 阅读 40

Numpy库基础

*
– 安装numpy库
– numpy介绍
– Numpy数组对象
–
+ 创建多维数组
+ 获取数组中的元素
+ Numpy数据类型
+ 数据类型对象
+ Numpy字符编码
+ 自定义数据类型
+ dtype类的属性
+ 创建自定义数据类型

安装numpy库

直接安装：

pip install numpy

换源安装

pip install numpy -i https://pypi.douban.com/simple

或者使用python集成环境anaconda进行安装

numpy介绍

NumPy（Numerical Python的缩写）是一个开源的Python科学计算库。使用NumPy，就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数，涵盖线性代数运算、傅里叶变换和随机数生成等功能

Numpy数组对象

numpy中主要操作的对象就是多维数组(ndarray)，该数组由两部分组成：

实际的数据
描述这些数据的元数据

而大部分的数组操作仅仅修改元数据部分，而不是修改底层的实际数据

NumPy中的数组一般是同质的（但有一种特殊的数组类型例外，它是异质的），即数组中的所有元素类型必须是一致的。这样有一个好处：如果我们知道数组中的元素均为同一类型，该数组所需的存储空间就很容易确定下来

与Python中一样，NumPy数组的下标也是从0开始的。数组元素的数据类型用专门的对象表示
*我们使用numpy中的arange函数创建数组，并获取其数据类型

import numpy as np
one_arr=np.arange(5)
one_arr.dtype

数组one_arr的数据类型为int32（在我的机器上是这样），当然如果你使用64位的Python，得到的结果可能是int64。不论是哪种情形，该数组的数据类型都是整数（64位或32位）。除了数据类型，数组的维度也是重要的属性

上述例子演示了怎样创建一个向量（即一维的NumPy数组）。向量在数学中很常用，但
大部分情况下，我们需要更高维的对象。先来确定一下刚刚所创建向量的维度：

one_arr.shape

上图所示：这是一个包含5个元素的向量，取值分别为0~4的整数。数组的shape属性返回一个元组（tuple），元组中的元素即为NumPy数组每一个维度上的大小。上面例子中的数组是一维的，因此元组中只有一个元素

创建多维数组

我们已经知道如何创建向量，现在可以试着创建多维的NumPy数组，并查看其维度

创建多维数组

two_arr=np.array([np.arange(2),np.arange(2)])
two_arr

查看其维度

two_arr.shape

在上面，我们将arange函数创建的数组作为列表元素，把这个列表作为参数传给array函数，从而创建了一个2×2的数组，而且没有出现任何报错信息
array函数可以依据给定的对象生成数组。给定的对象应是类数组，如Python中的列表。在上面的例子中，我们传给array函数的对象是一个NumPy数组的列表。像这样的类数组对象是array函数的唯一必要参数，其余的诸多参数均为有默认值的可选参数

获取数组中的元素

在这里我们就使用上面创建的 two_arr二维数组进行演示
在创建这个多维数组时，我们给 array函数传递的对象是一个嵌套的列表。现在来依次选取该数组中的元素。记住，数组的下标是从0开始的

a=two_arr[0,0]
a

上述就是从数组中或取元素。对于数组two_arr来说，只需要用two_arr[m,n]选取各数组元素，其中m和n为元素下标，对应的位置如下表所示:

Numpy数据类型

Python支持的数据类型有 整型、浮点型以及复数型，但这些类型不足以满足科学计算的需求，因此NumPy添加了很多其他的数据类型。在实际应用中，我们需要不同精度的数据类型，它们占用的内存空间也是不同的。在NumPy中，大部分数据类型名是以数字结尾的，这个数字表示其在内存中占用的位数
如下图所示

类型描述bool用一位存储的布尔类型（值为TRUE或FALSE）inti由所在平台决定其精度的整数（一般为int32或int64）int8整数，范围为-128至127int46整数，范围为-32768至32767int32整数，范围为-231至231-1int64整数，范围为-263至263-1uint8无符号整数，范围为0至255uint16无符号整数，范围为0至65535uint32无符号整数，范围为0至232-1uint64无符号整数，范围为0至264-1float16半精度浮点数（16位）：其中用1位表示正负号，5位表示指数，10位表示尾数float32半精度浮点数（32位）：其中用1位表示正负号，8位表示指数，23位表示尾数float64或float半精度浮点数（64位）：其中用1位表示正负号，11位表示指数，52位表示尾数complex64复数，分别用两个32位浮点数表示实部和虚部complex128或complex64复数，分别用两个64位浮点数表示实部和虚部

每一个数据类型均有对应的类型转换函数：
上述即为一部分numpy的数据类型转换函数
在NumPy中，许多函数的参数中是可以指定数据类型，通常这个参数是可选的：

arr=np.arange(7,dtype=np.uint16)

需要注意的是，复数是不能转换为整数的，这将触发TypeError错误：
同样，复数也不能转换为浮点数。不过，浮点数却可以转换为复数，注意，有j的部分为复数的虚部

数据类型对象

数据类型对象是 numpy.dtype类的实例。如上所述，NumPy数组是有数据类型的，更确切地说，NumPy数组中的每一个元素均为相同的数据类型。数据类型对象可以给出单个数组元素在内存中占用的字节数，即 dtype类的itemsize属性：

two_arr.dtype.itemsize
two_arr.dtype

Numpy字符编码

NumPy可以使用 字符编码来表示数据类型，这是为了兼容NumPy的前身Numeric。不推荐使用字符编码，但有时会用到，因此在下面还是列出了字符编码的对应表。我们在使用Numpy时应该优先使用dtype对象来表示数据类型，而不是这些字符编码

数据类型字符编码整数i无符号整数u单精度浮点数f双精度浮点数d布尔值b复数D字符串Sunicode字符串Uvoid （空）V

下面使用字符编码出创建numpy数组：
创建一个单精度浮点数数组：

a=np.arange(7,dtype='f')

也可创建一个复数数组

a=np.arange(7,dtype='D')

自定义数据类型

有很多种自定义数据类型的方法，以浮点型为例：

*可以使用Python中的浮点数类型：

np.dtype(float)

*可以使用字符编码来指定单精度浮点数类型:

np.dtype('f')

*可以使用字符编码来指定双精度浮点数类型：

np.dtype('d')

还可以将两个字符作为参数传给数据类型的构造函数。此时，第一个字符表示数据类型，第二个字符表示该类型在内存中占用的字节数（ 2、4、8分别代表精度为16、32、64位的浮点数）：

np.dtype('f8')

完整的Numpy数据类型列表可以在 sctypeDict.keys()中找到：

np.sctypeDict.keys()

dtype类的属性

dtype类有很多有用的属性。例如，我们可以获取数据类型的字符编码：

a=np.dtype('f8')
a.char

type属性对应于数组元素的数据类型：

a.type

str属性可以给出数据类型的字符串表示，该字符串的首个字符表示字节（endianness），后面如果还有字符的话，将是一个字符编码，接着一个数字表示每个数组元素存储所需的字节数。这里，字节序是指位长为32或64的字（word）存储的顺序，包括大端（bigendian）和小端序（little-endian）。大端序是将最高位字节存储在最低的内存地址处，用>表示；与之相反，小端序是将最低位字节存储在最低的内存地址处，用

a.str

创建自定义数据类型

自定义数据类型是一种 异构数据类型，可以当做用来记录电子表格或数据库中一行数据的结构。作为示例，我们将创建一个学生信息的数据类型。其中，我们用一个长度40个字符的字符串来记录学生名称，用一个32位的整数来记录学生的年龄，最后用个32位的单精度浮点数来记录学生的身高。下面是具体的步骤：
创建数据类型：

t = np.dtype([('name', np.str_, 40), ('age', np.int32), ('height',np.float32)])
t

查看数据类型（也可以查看某一字段的数据类型） :

t['age']

在用array函数创建数组时，如果没有在参数中指定数据类型，将默认为浮点数类型。而现在，我们想要创建自定义数据类型的数组，就必须在参数中指定数据类型，否则将触发TypeError错误：

student=np.array([('ycx',18,165.6),('fbl',22,188.8)],dtype=t)
student[1]

Original: https://blog.csdn.net/qq_45261963/article/details/122683182
Author: 温柔且上进c
Title: python数据分析基础之Numpy库详解（一）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/699030/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

九大数据分析法

九大数据分析法 1.周期性分析法 2.结构分析法 * 一、何为”结构”？二、知道”结构”有什么用？三、如何进行结构分析？四、结…

人工智能 2023年6月11日
0092
手把手教你用tensorflow2.3训练自己的分类数据集

配合视频一起食用这篇教程效果更佳：手把手教你用tensorflow2训练自己的数据集 tensorflow2.x版本对小白非常友好，2.x的api中对keras进行了合并，大家只需…

人工智能 2023年5月26日
00110
图像分类数据集(线性神经网络，需结合从零实现softmax回归一起学习)

文章目录 * – 图像分类数据集 – + 读取小批量 + 整合所有组件 + 小结图像分类数据集导入必要的类包。 import torch import …

人工智能 2023年6月17日
0068
OpenCV Point：二维/三维点

文章目录 Point 模板类 * 基本操作函数 Point 输出案例 Point 模板类 opencv中的数据类型多由模板类进行创建，因此对于点类而言也是如此，支持各种类型如int…

人工智能 2023年5月28日
0065
三.全局定位–LIO-SAM在RTK全局约束下建图和定位（1）

专栏相关文章：开源框架测试一：Tixiao Shan最新力作LVI-SAM(Lio-SAM+Vins-Mono)，基于视觉-激光-惯导里程计的SLAM框架，环境搭建和跑通过程_…

人工智能 2023年5月26日
00128
基于CNN-LSTM的手写数字识别与应用实现（附tensorflow代码讲解）

摘要 CNN卷积神经网络是图像识别和分类等领域常用的模型方法。由于CNN模型训练效果与实际测试之间存在较大的差距，为提高自由手写数字的识别率，尝试使用TensorFlow搭构CNN…

人工智能 2023年5月25日
0087
数据分析—-jupyter工具使用指导

1 首先确保已经安装Anaconda 如通过未安装，请参考数据分析—-数据分析环境搭建即在Windows10系统安装Anaconda集成环境安装 2 打开cmd窗口…

人工智能 2023年6月19日
0061
通俗易懂的机器学习——python手动实现DBSCAN聚类算法（不依赖已有框架）

手动实现DBSCAN算法 DBSCAN的工作原理 DBSCAN手动实现 * 依赖包手写DBSCAN类代码参数分析代码测试 DBSCAN的特点以及应用场景 DBSCAN的工作原…

人工智能 2023年5月31日
0070
训练数据数据分类和目标检测的非常关键的数据增强算法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月12日
0043
使用pivot_longer和pivot_wider进行长宽数据转换

获取更多R语言和生信知识，请欢迎关注公众号：医学和生信笔记医学和生信笔记公众号主要分享：1.医学小知识、肛肠科小知识；2.R语言和Python相关的数据分析、可视化、机器学习…

人工智能 2023年7月15日
0047
CUDA 11.3安装

显卡驱动 1. 检查cuda对应driver版本： https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.ht…

人工智能 2023年6月17日
0071
作为分类算法，逻辑回归是如何和回归扯上关系的

今天就逻辑回归和回归问题之间的关系做个梳理，下次再遇到谁扯逻辑回归如何如何做回归，我直接丢。。。仅个人拙见。文章目录 1 何为回归？何为分类？ 2 回归问题在拟合什么？分类问题…

人工智能 2023年7月3日
0058
KNN 实现数据分类

KNN算法：邻近算法，或者说K最邻近（KNN，K-NearestNeighbor）分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是K个最近的邻居的意思，说的是每个…

人工智能 2023年7月2日
0065
28【源码】数据可视化：基于 Echarts + Python Flask 动态实时大屏范例 – 数据分析看板

目录效果展示 1.动态实时更新数据效果图 2.鼠标右键切换主题 3. 数据标线&视觉映射效果 4. 大数据区域缩放效果一. 确定需求方案 1. 屏幕分辨率 2. 部…

人工智能 2023年6月11日
0087
阿里云天池大数据长期赛：金融风控-贷款违约预测（含代码）

前言一、赛题介绍二、数据描述性统计 2.1.读取数据 2.2.查看重复值 2.3.统计目标变量比例 2.4.查看数据的统计量 2.5.统计每个变量的种类 2.6.查看训练集…

人工智能 2023年7月15日
0081
二类医疗器械定义及分类

根据《医疗器械监督管理条例》对医疗器械实行分类管理，第二类医疗器械值,产品机制已取得国际、国内认可，技术成熟，其安全性必须加以控制的医疗器械，如电子体温表、脑或心电图、B超、胃镜、…

人工智能 2023年7月2日
0096

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30