Pandas入门笔记

2023年8月8日下午9:59 • Python • 阅读 61

文章目录

pandas
*
pandas 排序
pandas选择指定数据
pandas改变指定位置的值
pandas 处理文件
pandas 合并数据
pandas Merge
pandas 画图

pandas

pandas 和numpy的关系就像

字典和list的关系

s = pd.Series([-1,3,5,np.nan,9,12])

print(s)

dates = pd.date_range('20220101',periods=6)
print(dates)

df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['啊','对','对','对'])
print(df)

pandas 排序


df = pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

df1 = pd.DataFrame({'1':2.5,
                    '2':pd.Timestamp('20220428'),
                    '3':np.array([7]*4,dtype=int),
                    '4':pd.Categorical(["hr","boss","emp","man"]),
                    '5':"default"
                    })
print(df1)

print(df1.dtypes)

print(df1.index)

print(df1.columns)

print(df1.values)

print(df1.describe())

print(df1.sort_index(axis=1,ascending=False))
print(df1.sort_index(axis=0,ascending=False))

print(df1.sort_values(by='4',ascending=False))

pandas选择指定数据


dates = pd.date_range('20220428',periods=6)
df = pd.DataFrame(np.arange(24).reshape(6,4),
                  index=dates,
                  columns=['a','b','c','d'])
print(df)
print(df.a)
print('不能说一模一样,简直就是毫无差别')
print(df['a'])

print(df.loc['20220501'])

print(df.loc[:,'a'])

print(df.loc['20220501',['b','c']])

print(df.iloc[0,1])

print(df.iloc[1:3,1:3])

print(df.iloc[1:4,[0,3]])

print(df.b>12)

print(df[df.c>12])

pandas改变指定位置的值


df.iloc[1,1] = 2
df.loc['20220501','c'] = '13a'
df.d[df.a>19] = 22

df['e'] = 'error'
print(df)

df.iloc[(3,2)] = np.nan

print(df.dropna(axis=1,how='any'))
print(df.dropna(axis=0,how='any'))
print(df.fillna(value=0))

print(df.isnull())

print(np.any(df.isnull()) == True)
print(np.any(df.isnull()))

pandas 处理文件


data  =  pd.read_csv("Student.csv",sep='\t')
print(data)
data.to_pickle("student.pickle")
print(data['Name'])

pandas 合并数据


df1 = pd.DataFrame(np.ones((3,4))*0,
                   columns=['a','b','c','d'])
df2 = pd.DataFrame(np.ones((3,4))*1,
                   columns=['a','b','c','d'])
df3 = pd.DataFrame(np.ones((3,4))*2,
                   columns=['a','b','c','d'])

res = pd.concat([df1,df2,df3],axis=0)

res = pd.concat([df1,df2,df3],axis=0,ignore_index=True)
print(res)

df1 = pd.DataFrame(np.ones((3,4))*0,
                   columns=['a','b','c','d'],
                   index=[1,2,3])
df2 = pd.DataFrame(np.ones((3,4))*1,
                   columns=['b','c','d','e'],
                   index=[2,3,4])
df3 = pd.DataFrame(np.ones((3,4))*2,
                   columns=['c','d','e','f'],
                   index=[3,4,5])

res = pd.concat([df1,df2])
print(res)
res = pd.concat([df1,df2],join='outer')
print(res)

res = pd.concat([df1,df2],join='inner',ignore_index=True)
print(res)

res = df1.append(df2,ignore_index=True)
print(res)

res = pd.concat([df1,df2,df3],axis=1)
print(res)

pandas Merge


left = pd.DataFrame({'key':['K0','K1','K2','K3'],
                     'A':['A0','A1','A2','A3'],
                     'B':['B0','B1','B2','B3']})
right = pd.DataFrame({'key':['K0','K1','K2','K3'],
                     'C':['C0','C1','C2','C3'],
                     'D':['D0','D1','D2','D3']})

res = pd.merge(left,right,on='key')
print(res)

left = pd.DataFrame({'key1':['K0','K0','K1','K2'],
                     'key2':['K0','K1','K0','K1'],
                     'A':['A0','A1','A2','A3'],
                     'B':['B0','B1','B2','B3']})
right = pd.DataFrame({'key1':['K0','K1','K1','K2'],
                      'key2':['K0',"K0","K0","K0"],
                     'C':['C0','C1','C2','C3'],
                     'D':['D0','D1','D2','D3']})

print(left)
print(right)
res = pd.merge(left,right,on=['key1','key2'])
print(res)

print(left)
print(right)

res = pd.merge(left,right,on=['key1','key2'],how='inner')
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='outer')
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='left')
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='right')
print(res)

res = pd.merge(left,right,on=['key1','key2'],how='inner',indicator=True)
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='outer',indicator=True)
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='left',indicator=True)
print(res)
res = pd.merge(left,right,on=['key1','key2'],how='right',indicator=True)
print(res)

boys = pd.DataFrame({'k':['K0','K1','K2'],
                     'age':[18,20,23]})
girls = pd.DataFrame({'k':['K0','K0','K3'],
                      'age':[24,25,26]})
print(boys)
print(girls)

res = pd.merge(boys,girls,on='k',suffixes=['_boys','_girls'],how='outer')
print(res)

pandas 画图


data = pd.DataFrame(np.random.randn(1000,4),
                 index=np.arange(1000),
                 columns=list("abcd"))
data = data.cumsum()
print(data.head())

ax = data.plot.scatter(x='a',y='b',color='blue')
data.plot.scatter(x='c',y='d',color='red',ax=ax)
plt.show()

Original: https://blog.csdn.net/weixin_43759910/article/details/124747555
Author: 皇棠
Title: Pandas入门笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/743248/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python每日一练（牛客数据分析篇新题库）——第37天：合并

文章目录 1. 去掉信息不全的用户 2. 修补缺失的用户数据 3. 解决牛客网用户重复的数据 4. 统一最后刷题日期的格式《100天精通Python》专栏推荐白嫖80g Pyth…

Python 2023年8月7日
0051
用户行为分析的背景以及几种模型分析、实例分析——淘宝用户行为分析

这里写目录标题 1. 绪论 * 1.1了解用户行为分析 1.2用户行为分析的目的 2.用户行为分析的具体内容 * 2.1用户行为分析的指标 2.2用户行为分析模型 – …

Python 2023年8月29日
0051
使用 Mypy 检查 30 万行 Python 代码，总结出 3 大痛点与 6 个技巧！

作者：Charlie Marsh 译者：豌豆花下猫@Python猫在 Spring ，我们维护了一个大型的 Python 单体代码库（英：monorepo），用上了 Mypy 最…

Python 2023年10月23日
0037
Python绘制世界疫情地图

世界疫情数据下载：方法一：关注微信公众号大数据智库（公众号二维码在我的主页左下角），回复疫情数据，即可获取网盘链接方法二：在gitee上面下载》》点击：疫情数据下载注：此数据是…

Python 2023年8月2日
0043
对plot_surface()以及meshgrid()的详细理解

如果你想用python绘制一个3D图，你肯定会见过下面这部分代码： fig = plt.figure(figsize=(12, 8)) ax = Axes3D(fig) 指定间隔 …

Python 2023年8月23日
0058
配置pygame环境

配置pygame环境 pygame是什么？配置pygame环境 * 1.检查计算机信息 2.配置python环境 3.安装pygame 那些人不建议学习pygame pygame…

Python 2023年9月21日
0058
Python绘制多因子柱状图到底有多简单

Original: https://www.cnblogs.com/123456feng/p/16199490.htmlAuthor: 蚂蚁ailingTitle: Python绘…

Python 2023年11月3日
0040
Pandas常见方法（2）-pandas对数据的预处理

说明：本blog基于python3， pandas 1.3.5版本本文主要介绍如何对数据做预处理，包括缺失值过滤、缺失值补全、数据转换（重复值删除，数据映射、数据替换）、简单运…

Python 2023年8月16日
0067
Python异步协程（asyncio详解）

续上篇讲解yield from博客，上篇链接：https://www.cnblogs.com/Red-Sun/p/16889182.htmlPS：本博客是个人笔记分享，不需要扫码加…

Python 2023年10月13日
0065
Jenkins安装部署使用图文详解（非常详细）

前言最近公司需要弄一套自动化运维部署，于是抽空学习了一下，用了两天左右完成Jenkins的安装部署和各种项目的配置化，于是整理一下进行分享。介绍 Jenkins是一个独立的开源…

Python 2023年6月3日
0074
Python OpenCV配置CUDA以支持GPU加速 (不使用Visual Studio)

Welcome to My Blog 文章唯一地址：https://blog.csdn.net/REAL_liudebai/article/details/119356958 问题…

Python 2023年8月2日
0083
python内置函数03

python内置函数03 原创 wx5e6caa8b9792d2022-08-01 17:01:57博主文章分类：Python自动化开发 ©著作权文章标签 ascii码文章分类…

Python 2023年5月24日
0092
Flask+nginx+gunicorn在腾讯云轻量服务器上的部署

参考链接： 1.安装配置： 1、安装nginx切换到root用户下： sudo apt-get update sudo apt-get install nginx nginx -v…

Python 2023年8月10日
0043
numpy矩阵求最值、均值、方差、标准差、中值、求和，众数

一、最值获得整个矩阵、行或列的最大最小值。 import numpy as np a = np.array([[1,2,3,3],[4,5,6,2],[0,8,4,9]]) pr…

Python 2023年8月23日
0056
React-性能优化（不用memo）

React-性能优化（不用memo）相信大家在使用React时，经常会遇到页面出现重复渲染的情况，有时候，可能渲染的数据不多，从视觉上感觉不到性能的消耗，但是有时候却很尴尬，比如…

Python 2023年10月8日
0062
Vite+React搭建开发构建环境实践

使用 Vite 已经有两年了，期间使用它开发过单页面应用，也开发过浏览器扩展插件，对比日常工作中用到的 webpack 构建速度大幅提升，开发体验也好很多。虽然相比于 webpac…

Python 2023年10月22日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas入门笔记

文章目录

pandas 排序

pandas选择指定数据

pandas改变指定位置的值

pandas 处理文件

pandas 合并数据

pandas Merge

pandas 画图

大家都在看