DataFrame的构建及一些操作

2023年6月2日上午5:21 • 人工智能 • 阅读 56

一、DataFrame构建

1.用多个列表构建

构建DataFrame

self._stkpool_uni、codes、end_date（这些list用append填充值，保证各个list中元素个数一致）

dfData = {“STK_UNI_CODE”:self._stkpool_uni, “STK_CODE”:codes, “END_DATE”:end_date,
“SCORE_FAC”:score, “DIS_FAC”:descri, “RAT_FAC”:star, “MAC_FAC”:mac}
df = pd.DataFrame(data=dfData)

2.用一个列表构建（其中列表元素为dict，dict的值来自tuple）

findata_list = [] #定义一个空list
for res in query_Object: #res是元组
dict_fin = {} #定义一个空dict
for arr in range(0,len(res)): #for循环元组
dict_fin[columns[arr]] = res[arr] #给dict填值
findata_list.append(dict_fin) #给list填值
dfQuery = pd.DataFrame(findata_list) #通过list构建DataFrame

3.指定列的顺序

df_data = {“公式代码”:gsCode, “股票市场”:gpMarket, “股票代码”:gpCode, “日期”:signalDate, “新接口”:mField, “老接口”:mFieldOnline}
col = [‘公式代码’,’股票市场’,’股票代码’,’日期’,’新接口’,’老接口’]
df = pd.DataFrame(data=df_data,columns=col)

二、DataFrame一系列小操作总结

1.DataFrame排序

①.根据列值排序（sort_values）

df_return = df_return.sort_values([‘date’, ‘gpcode’], ascending=[0,1]) # 排序，0倒序，1正序

②.根据索引值排序（sort_index）

dfSort = dfSort.sort_index(ascending=False)

2.DataFrame query

strsql = “index

3.DataFrame groupby、pandas.core.groupby.GroupBy.nth

strsql = “index

gb = df_entrydate.groupby(‘gpcode’) #按gpcode分组

ret = gb.nth(0) #取groupby之后的第1组数据

4.DataFrame取值

①根据已知索引取值（ix）

res= dfQuery.ix[index]

②取一段数据块（iloc, loc）

1.ret = copy.copy(df_entrydate.iloc[:1]) #取dataframe第一行数据

5.DataFrame修改值

①更改某列的某一个值（loc[索引值，列名]）

df_stopdate.loc[df_stopdate.index, “date”] = dict_stopdate[key]

②df_stopdate[‘date’][1]= ‘2016-01-01’

df_stopdate[‘date’] = ‘2016-01-01’

6.DataFrame设置索引(set_index)

①重置索引（reset_index）

df_return = df_return.reset_index()

②设置索引(set_index)

df_return = df_return.set_index(‘a’, ‘b’)

③

import copy
ret = copy.copy(df_entrydate.iloc[:1]) #取dataframe第一行数据
ret.index=[[gpcode],[date]]
ret.index.names=[“gpcode”,”date”]
df_return = df_return.append(ret)

7.DataFrame取一列索引的值

①一重索引取值

df.index.tolist()

②多重索引取值（df.index.get_level_values(‘列名’)）

dfQuery.index.get_level_values(‘gpcode’)

8.DataFrame删除

① 某一列（del）

del(df_entrydate[“gpcode”])

② 某一列（drop、axis=1）

df = df.drop([‘col1′,’col2’],axis=1)

③ 某一行（drop、axis=0）

df = df.drop([0],axis=0) #删除第一行

9.DataFrame的某一列转换类型

prit dfQuery.dtypes

pandas中没有”string”，string类型的被存为object。

将date列转换成datetime64类型

import numpy as np

dfQuery[‘date’] = dfQuery[‘date’].astype(np.dtype(“datetime64”))

print dfQuery.dtypes

未完待续。。。

其他操作参见：http://www.cnblogs.com/chaosimple/p/4153083.html

Original: https://www.cnblogs.com/SZxiaochun/p/6290514.html
Author: 那一剑的風情
Title: DataFrame的构建及一些操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/559847/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

随笔记录——pandas 中 Dataframe.to_dict()

在工作中，使用pandas时，常常需要将dataframe中的数据按照指定的格式输出给下游使用，很多时候，下游指定的格式并不是很特别，而是比较常见的，这时，我们就不需要自己专门定义…

人工智能 2023年7月6日
0059
“人生苦短，我用Python“——Web测试

Web应用测试对Web应用进行渗透测试 * HTTP 对Web程序进行渗透测试所需模块 – urllib2库的使用 + urllib2.urlopen() urlli…

人工智能 2023年7月4日
0056
知识图谱基本概念

1.1 知识图谱定义与发展历程知识图谱在维基百科的定义：使用语义检索，从多种来源收集信息，以提高搜索质量的知识库。 1965年，斯坦福大学的E.A.Feigenbaum提出专家系…

人工智能 2023年6月1日
0066
基于 pytorch 实现语音识别有代码有数据

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0057
数学建模学习（102）：成分数据分析之中心对数比转换

为什么要写这篇文章？背景源于2022国赛C题的评阅要点，很多参加数模的同学应该都看到了，估计几乎没有人听说过这个方法。因此，本文对该方法进行一个讲解。当然，其实你在这次比赛中没有用…

人工智能 2023年7月27日
0057
自然语言处理(NLP)-知识图谱：知识表示学习（知识图嵌入）—-＞知识推理【TransE系列模型】【第三方库：OpenKE（清华大学开源）】

表示学习又称表征学习( Representation learning) ，主要是利用机器学习技术自动获取每个实体或者关系的向量化表达，旨在将描述对象表示为低维稠密向量( 即 …

人工智能 2023年6月1日
0076
时间序列的数据分析(四):STL分解

之前已经完成了三篇关于时间序列的博客，还没有阅读过的读者请先阅读：时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间…

人工智能 2023年7月6日
00143
计算机图形学-颜色科学基础

1.物体的颜色： 2.颜色视觉机理：三原色（不解释色盲）对立颜色（四色学说；不解释红绿蓝产生所有颜色） 3.颜色空间：与图形处理相关的颜色空间： RGB、CMY 与设备无关：…

人工智能 2023年6月22日
0071
10个Pandas的小技巧

pandas是数据科学家必备的数据处理库，我们今天总结了10个在实际应用中肯定会用到的技巧 1、Select from table where f1=’a’…

人工智能 2023年7月8日
0069
bayer raw & RGB raw

Bayer Pattern——RGGB – 梅长苏枫笑 – 博客园图像处理——传感器原始图像格式:Bayer RGB 和RGB RAW_夜风的博客-CSD…

人工智能 2023年6月20日
0060
【深度学习】(9) CNN中的混合域注意力机制（DANet，CBAM），附Tensorflow完整代码

各位同学好，今天和大家分享一下如何使用 Tensorflow构建 DANet和 CBAM混合域注意力机制模型。在之前的文章中我介绍了CNN中的通道注意力机制 SENet 和 EC…

人工智能 2023年5月26日
0076
[dp]洛谷P1990 覆盖墙壁 / Leecode790. 多米诺和托米诺平铺

洛谷题目链接Leecode题目链接这两道题本质上是同一道题.在洛谷挺早就见过这道题了,但由于过于抽象没看懂就没做,直到今天在Leecode每日一题又见到了这道题. 看到大概就能猜…

人工智能 2023年6月29日
0067
多元线性回归分析spss结果解读_SPSS 多元线性回归结果重要参数解读

当自变量过多时，选择步进，此方法可以自动剔除对因变量影响小的变量。选择共线性诊断用于判断多个变量之间是否相互关联以及关联的程度德宾-沃森(Durbin-Watson)DW用来检…

人工智能 2023年6月18日
0073
介绍谱聚类（spectral clustering）

文章目录 * – 1、谱聚类概览 – 2、谱聚类构图 – 3、拉普拉斯矩阵 – 4、切图聚类 – 4.1RatioCut…

人工智能 2023年5月31日
0078
R语言报错记录The following objects are masked from ‘package:stats’:decompose, spectrum

报错记录🦖 大家好，这里是想做生信大恐龙🦖的生信小白，这是一条简短的报错记录，参考了其他博主的方法，如有侵权，请联系删除。报错记录报错记录🦖 报错原因解决方法总结报错原因…

人工智能 2023年7月14日
0051
win11+AMD的cpu+3060GPU电脑安装 tensorflow-GPU+cuda11+cudnn

win11电脑安装 tensorflow-GPU+cuda11 前言我新买的电脑是AMD的cpu+NVIDIA的3050GPU想试一试这个电脑跑深度学习，就安装一下tensorf…

人工智能 2023年5月23日
00102

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

DataFrame的构建及一些操作

构建DataFrame

self._stkpool_uni、codes、end_date（这些list用append填充值，保证各个list中元素个数一致）

大家都在看