Pandas的dataframe是类似java中数据库的一种结构。因为之前的代码使用了python,所以后台使用dataframe 作为数据库写了一个页面。下面是dataframe的一些基本操作。
创建DataFrame对象
datafra=pd.DataFrame(columns=['path','ndarray','level','evaluation','target'])
创建了以一个表格,内部的列坐标索引是自己定义的数据名称。
向DataFrame中增加数据。
Dataframe自动生成索引。
df=pd.DataFrame({'path':'D:\\Programes\\4 level\\1.tif','ndarray':np.NAN,'level':1,'evaluation':np.NAN,'target':False},index=[0])
datafra=datafra.append(df,ignore_index=True)
df为要向Dataframe加的数据,内容包括在{}内容中,index为0。下面调用Dataframe的append方法将这一行数据加入数据库。ignore_index=True为忽视df自带的索引0。
datafra=pd.DataFrame(columns=['path','ndarray','level','evaluation','target'])
df=pd.DataFrame({'path':'D:\\Programes\\ spherulization for deep learning\\4 level\\1.tif','ndarray':np.NAN,'level':1,'evaluation':np.NAN,'target':False},index=[0])
datafra=datafra.append(df,ignore_index=False)
df=pd.DataFrame({'path':'D:\\Programes\\spherulization for deep learning\\4 level\\2.tif','ndarray':np.NAN,'level':2,'evaluation':np.NAN,'target':False},index=[0])
datafra=datafra.append(df,ignore_index=False)
df=pd.DataFrame({'path':'D:\\Programes\\spherulization for deep learning\\4 level\\3.tif','ndarray':np.NAN,'level':3,'evaluation':np.NAN,'target':False},index=[0])
datafra=datafra.append(df,ignore_index=False)
print(datafra)
0 D:\Programes\ spherulization for deep learning... NaN ... NaN False
0 D:\Programes\spherulization for deep learning\... NaN ... NaN False
0 D:\Programes\spherulization for deep learning\... NaN ... NaN False
path ndarray ... evaluation target
0 D:\Programes\ spherulization for deep learning... NaN ... NaN False
1 D:\Programes\spherulization for deep learning\... NaN ... NaN False
2 D:\Programes\spherulization for deep learning\... NaN ... NaN False
查询数据
nulllist=datafra.index[datafra['evaluation'].isnull()].tolist()
def get_special_list(special):
special_list=dataframe.index[self.dataframe['evaluation']==special].tolist
使用tolist函数后返回值为所有满足条件的index值的list。
改变数据
datafra.loc[index,'evaluation']=4.5
index为要修改的数据的行,’evaluation’为列。注意index不可以有重复。
保存和读取表格
def save_as_csv(path):
datafra.to_csv(path,index=False)
def read_from_csv(path):
datafra=pd.read_csv(path)
注意dataframe本身保存时按index顺序保存,读取时按顺序读取。可以不保存index,多次保存可能会使表格中出现多个index值。解决方法是,保存时不保存index或者读取时只读一列index。
Original: https://blog.csdn.net/zbtsmd/article/details/119378375
Author: zbtsmd
Title: Pandas使用笔记-Dataframe的基本操作
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755595/
转载文章受原作者版权保护。转载请注明原作者出处!