pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

主题:记录pandas的常见建立dataframe方法

一、pd.DataFrame()方法(创建1列的情景)

(1)传入pd.DataFrame()的内容,是一个dict(字典)

(2)在原有数据集上添加某个列和值

将后者的数值(value)赋给其他数据集或列

import pandas as pd
datas=pd.DataFrame({'出场顺序':['1','2','3','4'],'打分等级':['A','B','C','D']})
datas['是否出场']=['是' for i in range(4)]
datas['出演人数']=[1 for i in range(4)]
datas['本地人']=pd.DataFrame(data=['是','否','是','否'])
datas['非外国人']=pd.DataFrame(data=datas['本地人'])
#datas['非外国人']=pd.DataFrame(datas['本地人'])
datas

结果如图:

pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

(3)pd.DataFrame()独立创建1列

list=['aa','AA','Aa','aA']
data=pd.DataFrame(list,columns=['生物基因组合'])

这里需留意,如果 columns参数没有添加中括号,即代码:data=pd.DataFrame(list,columns=[‘生物基因组合’]), 将报错

Index(...) must be called with a collection of some kind, 'xxx'(列名) was passed

(4)将创建的新数据列直接放在某个数据列后面(前提:行数一致),采用pd.concat()方法

data_result=pd.concat([datas,data],axis=1)
#data_result

结果:

pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

二、pd.DataFrame()方法(创建多列的情景)

(1)传入pd.DataFrame()的内容,是一个dict(字典),在字典里体现多列

(2)默认添加数据是按行添加

list_x=[1,3,4]
list_y=[1,9,16]
data_demo=pd.DataFrame(data=[list_x,list_y],columns=['第一列','第二列','第三列'])
data_demo

结果:

pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

(3)通过pd.DataFrame()创建多列,按列添加数据

list_x=[1,3,4]
list_y=[1,9,16]
data_test=pd.DataFrame([list_x,list_y]).T
data_test.rename(columns={0:'第一列',1:'第二列'},inplace=True)

结果:

pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

三、将嵌套的list拆分成不同列,存为dataframe

import pandas as pd
arr=[[2,8],[3,27],[4,64]] #list
#arr[0][0]=2,arr[1][0]=3,arr[2][0]=4
#arr[0][1]=8,arr[1][1]=27,arr[2][1]=64
list_X=[]
list_Y=[]
for i in range(len(arr)):
    list_X.append(arr[i][0])
    list_Y.append(arr[i][1])
list_X [2,3,4]
list_Y [8,27,64]
result=pd.DataFrame({'横坐标': list_X,'纵坐标': list_Y})
result

结果包括两列:

横坐标列为:2,3,4纵坐标列为:8,27,64

四、参考网址

Python报错TypeError: Index(…) must be called with a collection of some kind, ‘ ‘ was passed columns_给我一点温度-CSDN博客pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列https://blog.csdn.net/sinat_26811377/article/details/98741330 ;

python数据拼接: pd.concat – boobo – 博客园1.concat concat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合 参数说明 objs: series,dataframe或者是panel构成的序列lsitt&#pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列https://www.cnblogs.com/RB26DETT/p/11555099.html ;

Original: https://blog.csdn.net/weixin_43718742/article/details/121861911
Author: weixin_43718742
Title: pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/695239/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球