主题:记录pandas的常见建立dataframe方法
一、pd.DataFrame()方法(创建1列的情景)
(1)传入pd.DataFrame()的内容,是一个dict(字典)
(2)在原有数据集上添加某个列和值
即
将后者的数值(value)赋给其他数据集或列
import pandas as pd
datas=pd.DataFrame({'出场顺序':['1','2','3','4'],'打分等级':['A','B','C','D']})
datas['是否出场']=['是' for i in range(4)]
datas['出演人数']=[1 for i in range(4)]
datas['本地人']=pd.DataFrame(data=['是','否','是','否'])
datas['非外国人']=pd.DataFrame(data=datas['本地人'])
#datas['非外国人']=pd.DataFrame(datas['本地人'])
datas
结果如图:
(3)pd.DataFrame()独立创建1列
list=['aa','AA','Aa','aA']
data=pd.DataFrame(list,columns=['生物基因组合'])
这里需留意,如果 columns参数没有添加中括号,即代码:data=pd.DataFrame(list,columns=[‘生物基因组合’]), 将报错:
Index(...) must be called with a collection of some kind, 'xxx'(列名) was passed
(4)将创建的新数据列直接放在某个数据列后面(前提:行数一致),采用pd.concat()方法
data_result=pd.concat([datas,data],axis=1)
#data_result
结果:
二、pd.DataFrame()方法(创建多列的情景)
(1)传入pd.DataFrame()的内容,是一个dict(字典),在字典里体现多列
(2)默认添加数据是按行添加
list_x=[1,3,4]
list_y=[1,9,16]
data_demo=pd.DataFrame(data=[list_x,list_y],columns=['第一列','第二列','第三列'])
data_demo
结果:
(3)通过pd.DataFrame()创建多列,按列添加数据
list_x=[1,3,4]
list_y=[1,9,16]
data_test=pd.DataFrame([list_x,list_y]).T
data_test.rename(columns={0:'第一列',1:'第二列'},inplace=True)
结果:
三、将嵌套的list拆分成不同列,存为dataframe
import pandas as pd
arr=[[2,8],[3,27],[4,64]] #list
#arr[0][0]=2,arr[1][0]=3,arr[2][0]=4
#arr[0][1]=8,arr[1][1]=27,arr[2][1]=64
list_X=[]
list_Y=[]
for i in range(len(arr)):
list_X.append(arr[i][0])
list_Y.append(arr[i][1])
list_X [2,3,4]
list_Y [8,27,64]
result=pd.DataFrame({'横坐标': list_X,'纵坐标': list_Y})
result
结果包括两列:
横坐标列为:2,3,4 ; 纵坐标列为:8,27,64
四、参考网址
Original: https://blog.csdn.net/weixin_43718742/article/details/121861911
Author: weixin_43718742
Title: pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/695239/
转载文章受原作者版权保护。转载请注明原作者出处!