第三节课 Pandas，Numpy的简单使用

2023年7月18日上午7:32 • 人工智能 • 阅读 50

pip install numpy

安装jupyter，安装notebook

jupyter notebook

创建一个二维表

调用包：import numpy as np

创建二维表

nd = np.array([[1,2],[2,3]])

转换数据类型

nd1 = nd.astype(“float”)

先看行后看列

array([[ 1, 2, 3], [ 4, 5, 6], [ 7, 8, 9], [10, 11, 12]])

4*3的

切片：

[行的切片，列的切片]

[行的起始位置:行的结束位置：步长，列的起始位置：列的结束位置：步长]

坐标系，行标0列标1

矩阵的运算

对位运算

直接加减乘除

对应位置相加减乘除

矩阵运算

nm的矩阵 * mn的矩阵

（n，n）第n行乘以第n列相加

np.dot(nd1,nd2)

np.dot(nd1/nd2)

科学计算

对结构化数据的操作

DataFrame df结构化数据,兼具numpy高性能的数组计算功能

series是一种类似于一维数组的对象，由数据以及与之相关的数据标签即索引组成

Series

总共两列，kv格式

可以手动创建索引

DataFrame

是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值，字符串，布尔值等）

dataframe既有行索引也有列索引，可以看作由Series组成的字典

df1.head()查看dateframe，默认前5数据

索引一行为series，多行dataframe

读取数据

pd.read_csv(“文件路径”)

分组聚合

df1.groupby(‘clazz’)[‘id’].count()

重新设置索引

.reset_index()

重新设置名字

clazz.rename(columns={“id”:”cnt”})

df2.sort_values(‘cnt’,ascending=False)

支持切片

df2.sort_values(‘cnt’,ascending=False)[0:3]

取某一行

df2.loc[5]，支持切片

查看类型

df2.loc[5]

统计数值型的列

df1.describe()

列之间关系

df1.corr()

数据关联

df1.merge(sumdf,left_on=’id’,right_on=’id’,how=’left’)

去重要指定行列，默认行

stu_sum[‘first_rank’] = stu_sum.groupby(‘clazz’)[‘sum’].rank(method=’first’,ascending=False)

pip install seaborn

解决中文乱码问题

import matplotlib.pyplot as plt

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]

调整大小

plt.figure(figsize=(16,8))

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]

plt.figure(figsize=(16,8))

sns.barplot(x=”clazz”, y=”sum”, hue=”first_rank”, data=top3)

plt.title(“top3”)

plt.xlabel(“班级”)

plt.ylabel(“总成绩”)

plt.ylim((400,600))

plt.show()

Original: https://blog.csdn.net/m0_47120517/article/details/121961061
Author: 胡说龙龙
Title: 第三节课 Pandas，Numpy的简单使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/700359/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

在Logistic回归中，特征工程对于提高模型性能至关重要。常见的特征工程包括多项式特征、交互特征和特征选择等

特征工程在Logistic回归中的重要性特征工程在机器学习中扮演着重要的角色，尤其是在Logistic回归中。通过对特征进行转换、选择和组合，特征工程能够帮助提高模型的准确性和性…

人工智能 2024年1月6日
0047
【最新最详细】SQL Server 2019 安装教程

下载SQL Server引擎，下载地址：https://www.microsoft.com/en-us/sql-server/sql-server-downloads，点击下载下…

人工智能 2023年7月30日
0076
盘点一个Pandas中explode()爆炸函数应用实际案例

点击上方” Python爬虫与数据挖掘“，进行关注回复” 书籍“即可获赠Python从入门到进阶共10本电子书今日鸡汤莫…

人工智能 2023年6月11日
0076
dbscan内存不够_使用DBSCAN（大矩阵计算）进行聚类时出现内存错误

我用DBSCAN对数据进行聚类，以去除异常值。由于scikit learn中的DBSCAN实现无法处理几乎1gb的数据，因此计算非常消耗内存。这个问题已经提到了here 下面代码的…

人工智能 2023年6月2日
0067
torch.topk() 函数详解

作用：返回列表中最大的n个值例子1：m=torch.arange(0,10)print(m.topk(3)) torch.return_types.topk( values=…

人工智能 2023年7月5日
0077
安装tensflow2 CPU版经历

此文为个人安装过程，仅供参考当前配置：● Win10 家庭中文版● Python版本：3.10 由于Tensflow和Anaconda3都只支持到Python3.9，所以只能降级…

人工智能 2023年5月24日
0088
从零搭建音乐识别系统（三）音乐分类模型

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月2日
0070
【数据处理必备Numpy~python】

import numpy as np numpy.mean() numpy.mean() 函数返回数组中元素的算术平均值 算术&…

人工智能 2023年6月15日
0077
三维点云地图转二维栅格地图

三维点云地图转二维栅格地图的实现需要1.地图转换工具——octomap；2.栅格地图保存工具——map_server；3.点云发布和转换工具启动launch文件。安装octoma…

人工智能 2023年6月10日
00159
下载MNIST数据集并使用python将数据转换成NumPy数组(源码解析)

下载MNIST数据集并使用python将数据转换成NumPy数组 * – 首先来分析init_mnist函数 – 接下来继续分析load_mnist函数 &…

人工智能 2023年6月16日
0091
opencv 仿射变换代码解析 warpPerspective()，remap()

void warpPerspective(InputArray src, OutputArray dst, InputArray M, Size dsize, int flags=…

人工智能 2023年7月20日
0061
语音识别原理与应用第三章语音特征提取

目录第三章语音特征提取 3.1预处理 3.2 短时傅立叶变换 3.3听觉特性 3.4线性预测 3.5倒谱分析 3.6常用的声学特征第三章语音特征提取原始语音是长度可变的时…

人工智能 2023年5月23日
0082
Android R窗口Window的requestlayout过程大揭秘

Android R窗口Window的requestlayout过程大揭秘 Android应用程序窗口设计系列博客: Android应用程序窗口设计之Window及WindowMan…

人工智能 2023年6月28日
0086
VisionTransformer（二）—— 多头注意力-Multi-Head Attention及其实现

多头注意力-Multi-Head Attention及其实现目录多头注意力-Multi-Head Attention及其实现前言一、为什么要有Attention，注意力是什…

人工智能 2023年7月28日
0080
matlab读取txt文件

如何编写MATLAB程序才能实现对.TXT文档的读写呢？MATLAB提供了一系列低层输入输出函数，专门用于文件操作。本文提供了几种Matlab读写文件的方法和预写的脚本。这里提供…

人工智能 2023年6月22日
0072
Topic 13. 临床预测模型之一致性指数 (C-index)

前言 C-index，C指数即一致性指数（concordance index），用来评价模型的预测能力。C指数是指所有病人对子中预测结果与实际结果一致的对子所占的比例。它估计了预测…

人工智能 2023年6月24日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

第三节课 Pandas，Numpy的简单使用

大家都在看