Pandas学习与总结

生成表格

  • *调用pandas库
import pandas as pd
  • *调用DataFrame:
df = pd.DataFrame(data = data)

参数:

data: 可以使用标量,变量,方法,字典等

index: 默认为数字,修改见下文

column:默认为表格内原有值或数值,修改见下文

实例:

Pandas学习与总结
  • *加载Excel:
csv格式
df = pd.read_csv('data_set.csv')
xlsx格式
df = pd.read_xlsx('data_set.xlsx')

实例:

Pandas学习与总结

操作相似,只展示一种文件格式

基础信息

  • *维度查看
#维度查看
df.shape

#数据格式查看
df.dtypes

#查看数据结构(行数,列名,null值情况,数据格式等)
df.info()

#查看某列唯一值
df[column1].unique()

实例:

查询数据维度与格式

Pandas学习与总结

查询数据信息与唯一值

Pandas学习与总结
  • *值查看
df.values

实例:查询值

Pandas学习与总结
  • *索引查看及修改
#查看
df.index

#修改方法1:
df.reset_index()

#修改方法2:
df.rename(index={0:'修改值'})

实例: 查询索引

Pandas学习与总结

修改方法1:

Pandas学习与总结

注:标红列为新的index,index列变为数据中的一部分

修改方法2:该方法与修改列名方法3相似,详情见下

Pandas学习与总结

注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称

  • *列名查看及修改
#查询
df.columns

#修改:方法1
columns_change = ['', '', '']
df.columns = columns_change

#修改:方法2
df.rename(columns={'categoru':'category_size'})

注:

方法1用于修改列名的列表,里面的值的数量需要与df中列的数量保持一致,否则报错;

方法2无该上述问题,用字典把原字段名称和需要改的名字组成键值对即可

实例:查询列名

Pandas学习与总结

修改方法1:

Pandas学习与总结

修改方法2:

Pandas学习与总结

注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称

  • *综合查看
#数据集的值查看
df.head()

#数据集的值查看
df.tail()

实例:数据集查看

head()中填几就显示表头几行数据,默认值为5

Pandas学习与总结

tail()中填几就显示表尾几行数据,默认值为5

Pandas学习与总结
  • *空值查看
空值查看
df.isnull

某列空值查看
df['column'].isnull

实例:

全表空值查看

Pandas学习与总结

某列空值查看

Pandas学习与总结

Original: https://blog.csdn.net/weixin_50476414/article/details/123783925
Author: Charliewyzzzz
Title: Pandas学习与总结

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/675035/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球