Pandas学习笔记

2023年7月8日上午3:55 • 人工智能 • 阅读 88

Pandas学习笔记

导入库

import pandas as pd

读取文件数据

df = pd.read_csv("data/dogName.csv")

Series函数

带标签的一维数组；构成：键值

t = pd.Series([1,2,3,4,5])

改变索引

t2 = pd.Series([1,2,3,4,5],index=list("abcde"))

通过字典创建

temp_dict = {"name":"xiaohong","age":30,"tel":10086}
a = pd.Series(temp_dict)

几种取值方式

a[:]
a["tel"]
a[:2]
a[["name","age","f"]]
t[t>4]
a.index
list(a.index)
a.values

DataFrame函数

二维，行索引index(axis=0),列索引columns（axis=1）

pd.DataFrame(np.arange(12).reshape(3,4))

更换索引值

pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("XYZW"))

利用字典

d1 = {"name":["小红","小刚"],"age":[22,25],"tel":[10086,10010]}
pd.DataFrame(d1)

d2 = [{"name":"xiaoming","age":11,"tel":10086},{"name":"xiaozhang","age":12},{"name":"liming"}]
m = pd.DataFrame(d2)

DataFrame()的几种属性

; 一个小练习：找到狗的名字的数量的最大值

import pandas as pd
df = pd.read_csv("data/dogName.csv")
df = df.sort_values(by="Count_AnimalName",ascending=False)
print(df.head(5))

取值

取行取列 []中写数组表示对行操作，[]中写字符串，表示对列操作

print(df[:20])
print(df["Row_Labels"])
print(df[:20]["Row_Labels"])

loc和iloc函数

loc函数通过标签做获取行数据
iloc函数通过位置获取行数据

; loc

n.loc["a","Z"]

n.loc["a",:]

n.loc[["a","c"],]

iloc

n.iloc[1]

n.iloc[:,2]

n.iloc[1:,2:]

缺失数据处理

pd.isnull(m)

删除NAN所在的行 all全部满足NAN any部分满足NAN inplace原地修改

m.dropna(axis=0,how="all",inplace = False)

填充数据

m.fillna(0)

NAN不部分填充中值数据

m.fillna(m.mean())

某一列NAN不部分填充中值数据

m["age"] = m["age"].fillna(m["age"].mean())

处理0表示缺失的0的数据


m[m==0] = np.nan

Original: https://blog.csdn.net/htthr/article/details/126710939
Author: 飞飞飞KiKi
Title: Pandas学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/677703/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习第一章发展历史与背景

文章目录一、什么是机器学习 * 1、机器学习的发展历史和背景 – 1.1 人工智能与机器学习 1.2 机器学习的发展历程 2、机器学习的基本概念 – 2….

人工智能 2023年7月27日
0090
聚类算法（K-means & AGNES & DBSCAN）

一、聚类算法基本概念 1. 定义：聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大。即聚类后同一类的数据尽可能聚集到…

人工智能 2023年6月16日
0085
GAN（生成对抗网络）的系统全面介绍（醍醐灌顶）

目录 0.预备知识 1.GAN的介绍 1.1 GAN的基本概念介绍 1.2 GAN的基本架构图 2.一个GAN的形成过程 2.1训练GAN：生成网络和判别网络的训练 (优化) 具体…

人工智能 2023年6月15日
0075
anaconda jupyter NLP spacy.load(‘en_core_web_sm‘)问题

win10，anaconda环境，jupyternotebook里，安装en_core_web_sm遇到的问题，整了一两天，终于能用了，也是参考了网上各种帖子，总结如下： 1、安装…

人工智能 2023年5月31日
0090
如何在Framework中优化AI算法的性能

如何在Framework中优化AI算法的性能在使用Framework进行AI算法的开发和优化时，我们可以采取一系列的措施来提高算法的性能。本文将详细介绍如何在Framework中…

人工智能 2024年1月1日
0044
pid摄像头循迹（opencv和openmv）

pid摄像头循迹（opencv和openmv）用摄像头进行循迹的方法参考 * 硬件选型方面软件思路一.图像预处理：代码部分二.线性拟合 opencv线性拟合：实际在树莓…

人工智能 2023年7月18日
00116
跟我学Python图像处理丨图像分类原理与案例

摘要：本篇文章将分享图像分类原理，并介绍基于KNN、朴素贝叶斯算法的图像分类案例。本文分享自华为云社区《[Python图像处理] 二十六.图像分类原理及基于KNN、朴素贝叶斯算法…

人工智能 2023年7月29日
0092
弱小目标检测跟踪算法研究（5）基于顶帽变换（Top_hat）算法的红外弱小目标检测之背景抑制

基于顶帽变换（Top_hat）算法的红外弱小目标检测之背景抑制 1. 前言 2. 顶帽变换（Top_hat）算法 3. Matlab仿真 4. 小结 ; 1. 前言红外图像中的弱…

人工智能 2023年7月10日
0050
每天五分钟机器学习：神经网络比逻辑回归强大的本质

本文重点：本文就是想讲清楚两点：第一点是神经网络如何进行计算的，这个计算就叫做前向传播。第二点是神经网络可以理解为逻辑回归，它和逻辑回归不同的是，逻辑回归是直接使用样本x，…

人工智能 2023年6月16日
0074
基于预训练语言模型的检索- 匹配式知识图谱问答系统

基于预训练语言模型的检索- 匹配式知识图谱问答系统张鸿志，李如寐，王思睿，黄江华美团, 北京市朝阳区 100020 {zhanghongzhi03,lirumei,wang…

人工智能 2023年6月1日
00103
时间序列的数据分析(五):简单预测法

之前已经完成了四篇关于时间序列的博客，还没有阅读过的读者请先阅读：时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间…

人工智能 2023年6月19日
0082
注意力机制（Attention Mechanism）

注意力机制卷积、全连接、池化层都只考虑不随意线索注意力机制则显示的考虑随意线索随意线索被称之为查询（query）每个输入是一个值（value）和不随意线索（key）的对通…

人工智能 2023年7月13日
0055
华为AI认证＿语音处理实验

人工智能 2023年5月23日
0078
知识图谱系列（一）：如何构建一个简单的知识图谱

之前在了解对话系统的时候，就发现其实一个有应用价值的对话系统，需要引入外部知识辅助决策分析，所以我就打算最近学习一下知识图谱，并尝试结合知识图谱构建一个对话系统。知识图谱是谷歌提…

人工智能 2023年6月1日
0082
数据科学导引上机（5）

此次用到的是青少年社交网络中常用词数据，借此进行市场调研使用的方法是K-Means聚类方法，不介绍原理数据预处理 import pandas as pd teenager_sn…

人工智能 2023年5月31日
0057
Xavier初始化

文章题目：Understanding the difficulty of training deep feedforward neural networks原文链接：目录补充几…

人工智能 2023年6月16日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas学习笔记

导入库

读取文件数据

Series函数

改变索引

通过字典创建

几种取值方式

DataFrame函数

更换索引值

利用字典

DataFrame()的几种属性

; 一个小练习：找到狗的名字的数量的最大值

取值

loc和iloc函数

; loc

iloc

缺失数据处理

填充数据

处理0表示缺失的0的数据

大家都在看