生成表格
- *调用pandas库
import pandas as pd
- *调用DataFrame:
df = pd.DataFrame(data = data)
参数:
data: 可以使用标量,变量,方法,字典等
index: 默认为数字,修改见下文
column:默认为表格内原有值或数值,修改见下文
实例:
- *加载Excel:
csv格式
df = pd.read_csv('data_set.csv')
xlsx格式
df = pd.read_xlsx('data_set.xlsx')
实例:
操作相似,只展示一种文件格式
基础信息
- *维度查看
#维度查看
df.shape
#数据格式查看
df.dtypes
#查看数据结构(行数,列名,null值情况,数据格式等)
df.info()
#查看某列唯一值
df[column1].unique()
实例:
查询数据维度与格式
查询数据信息与唯一值
- *值查看
df.values
实例:查询值
- *索引查看及修改
#查看
df.index
#修改方法1:
df.reset_index()
#修改方法2:
df.rename(index={0:'修改值'})
实例: 查询索引
修改方法1:
注:标红列为新的index,index列变为数据中的一部分
修改方法2:该方法与修改列名方法3相似,详情见下
注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称
- *列名查看及修改
#查询
df.columns
#修改:方法1
columns_change = ['', '', '']
df.columns = columns_change
#修改:方法2
df.rename(columns={'categoru':'category_size'})
注:
方法1用于修改列名的列表,里面的值的数量需要与df中列的数量保持一致,否则报错;
方法2无该上述问题,用字典把原字段名称和需要改的名字组成键值对即可
实例:查询列名
修改方法1:
修改方法2:
注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称
- *综合查看
#数据集的值查看
df.head()
#数据集的值查看
df.tail()
实例:数据集查看
head()中填几就显示表头几行数据,默认值为5
tail()中填几就显示表尾几行数据,默认值为5
- *空值查看
空值查看
df.isnull
某列空值查看
df['column'].isnull
实例:
全表空值查看
某列空值查看
Original: https://blog.csdn.net/weixin_50476414/article/details/123783925
Author: Charliewyzzzz
Title: Pandas学习与总结
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/599760/
转载文章受原作者版权保护。转载请注明原作者出处!