【python4 之列与行：index 和列相互转化stack unstack，行列重命名，改变类别标签 , 对行、列重新排序；用数据定义index/columns pivot 】

2023年7月6日下午3:58 • 人工智能 • 阅读 65

行列间的转化与拼接

一、将index 和每一列的数值相互转化

将a列转为index列： set_index

【python4 之列与行：index 和列相互转化stack unstack，行列重命名，改变类别标签 , 对行、列重新排序；用数据定义index/columns pivot 】

将index 转为列a：

使用之前可以将index重命名：df.index.name = ‘aaa’

reset_index()

使用drop参数设置去掉原索引

reset_index(drop=True)

2. 重命名

（1）在构造变量的时候进行命名。

dt = pd.DataFrame(t1), index = ['], columns = [])

创造DataFrame：

a = pd.DataFrame(np.ones(2), index = [‘a1’, ‘a2’], columns = [‘bbb’])

b = pd.Series(np.ones(2), index = [‘a1’, ‘a2’])

（2）对index的名称进行命名

方法一：

a.index.name = ‘aaa’

a.columns.name=’bbb’

方法二：

a.columns =a.columns.rename(“bbb”)

a.index =a.index.rename(“aaa”)

创造DataFrame： a = pd.DataFrame(np.ones(4))

（2）对特定的行列进行命名

方法一：

dataframe.rename(columns = {“old1”: “new1”, “old2″:”new2”}, inplace=True)

dataframe.rename(index={0: “x”, 1: “y”})

方法二：

DataFrame.index = [newName]

DataFrame.columns = [newName]

（3）创造DataFrame，并直接定义index，columns

pd.DataFrame(history_data.Data,index=history_data.Fields,columns=history_data.Times).T

（4） rename的高级用法：

DataFrame.rename（mapper = None，index = None，columns = None，axis = None，copy = True，inplace = False，level = None ）

其中dict可以进行简写

h = dict(zip(aaa.columns, aaa.index))

df = df.rename(columns=h)

position_stock_pct.rename(lambda x: x + ‘_pct’, axis=’columns’)

二、双重索引：矩阵的index与columns 重新排列相互转化

stack 与 unstack

columns转为index：

df1 = df.stack()

双index 拆分转为columns

df1. unstack()

设置双索引，并针对特定索引进行转化

df1 = df.set_index([‘trade_dt’,’s_info_windcode’ ])

df2 = df1.unstack(‘s_info_windcode’)

查看第一个索引：ind=rawdata2.index.levels[0]

将双轴进行相互转化/填充：swaplevel

stock_mv1.swaplevel(1, 0)

三、重新排列分类：用其中的数据定义index/columns

pivot

data_df.pivot(index=’userNum’, columns=’subjectCode’, values=’score’)

index: 可选参数。设置新dataframe的行索引，如果未指明，就用当前已存在的行索引。

columns：必选参数。用来设置作为新dataframe的列索引。

values：可选参数。在原dataframe中选中某一列/几列的值，使其在新dataframe的列里显示。如果不指定，则默认将原dataframe中所有的列都显示，这里需要注意：为了将所有的值都显示出来，就会出现多层行索引的情况。

四、对行、列重新排序

对列进行重新排序：

col_new = [‘泛消费’, ‘周期’, ‘地产基建’, ‘大制造’, ‘科技成长’, ‘金融’]

indus_pos_collect_ranked = indus_pos_collect.loc[:, col_new]

以行重新排序：

indus_pos_new = indus_pos_new.sort_index()

五、改变类别标签

df[‘grade’] = df[‘grade’].cat.set_categories([‘very bad’, ‘bad’, ‘medium’, ‘good’, ‘very good’])

df[‘grade’].cat.set_categories([‘very bad’, ‘bad’, ‘medium’, ‘good’, ‘very good’], inplace=True)

df = pd.DataFrame({“ohoh”:[1,2,3, 4], “haha”:[‘a’, ‘b’, ‘b’, ‘c’]})

将列转化为category类型

df[“hihi”] = df[“haha”].astype(“category”)

df[‘hihi’].cat.categories = [“very good”, “good”, “very bad”]

Original: https://blog.csdn.net/HaileeRPIJNU/article/details/125407412
Author: HaileeRPIJNU
Title: 【python4 之列与行：index 和列相互转化stack unstack，行列重命名，改变类别标签 , 对行、列重新排序；用数据定义index/columns pivot 】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674278/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[附源码]java毕业设计大学生心理健康系统

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月28日
0068
C#基础巩固与进阶（定时语音播报+PDF水印+分片上传+EF6框架）

b站视频： 2022年C#进阶教程-C#应该学到什么程度（针对编程思维）前提 UI框架：WinForm(基于.net framework 4.6.1）、MaterialSkin….

人工智能 2023年6月27日
0064
ACMMM2021｜在多模态训练中融入“知识+图谱”：方法及电商应用实践

简介：随着人工智能技术的不断发展，知识图谱作为人工智能领域的知识支柱，以其强大的知识表示和推理能力受到学术界和产业界的广泛关注。近年来，知识图谱在语义搜索、问答、知识管理等领域得…

人工智能 2023年6月1日
0098
LeetCode刷题总结文档

前言本文的刷题顺序依照代码随想录进行，因此题目板块的划分也和代码随想录一致。每个版块我会按照以下内容进行组织：该类型题目的特征时间复杂度值得一讲的相关题目知识文章目录 &…

人工智能 2023年7月30日
0047
Python员工离职数据分析

Python员工离职数据分析 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt i…

人工智能 2023年7月9日
0053
目标检测系列算法:YOLOv7代码复现

交通视频检测复现：video/BV1Se4y1975L/ YOLOv7视频交通检测(看上去还是蛮快！）目录 0、模型结构简要说明 * 高效层聚合网络: concatenate模型…

人工智能 2023年7月9日
0076
OpenMV：14巡线小车

文章目录 * – + * 追小球的小车 * 巡线小车这个例子展示了在OpenMV Cam上使用get_regression（）方法获得ROI的线性回归。使用这种方法，…

人工智能 2023年5月26日
0060
汇总pandas中的dataframe的索引操作

文章目录 * – + 数据集 + loc索引 + iloc索引 + 特殊索引 + 修改索引数据集先建立好如下数据： import pandas as pd df =…

人工智能 2023年7月6日
0069
手把手教你用VS2017配置OpenCV

文章目录 * – 一、下载OpenCV安装包 – + 1、官网下载 + 2、网上资源 – 二、安装OpenCV – + 1、解压文件…

人工智能 2023年7月20日
0052
服务器和虚拟机怎么安装Kaldi？

文章目录前言克隆kaldi到本地 tools/INSTALL安装 * 检查依赖extras/check_dependencies.sh 把四个依赖包放在tools/目录下修改…

人工智能 2023年5月27日
0074
笔记 | 基于Yolov5的口罩识别（持续更新）

目录前言一、目标检测简介 1.yolo系列的简介 2.yolov5简介二、数据集处理 1.数据文件处理 2.标签的处理 3.标签的转换三.模型配置参数 1.train.py…

人工智能 2023年6月15日
0071
Python统计学11——分位数回归

分位数回归也是数理统计里面经典的模型，他相对于在最小二乘模型上进行了改进，虽然本身还是线性的参数模型，但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小，分位数的损…

人工智能 2023年6月24日
0070
百分点大数据技术团队：基于HugeGraph的知识图谱技术在白酒行业的落地实践

编者按：信息化是企业在外部环境变化时保持核心竞争力的有力手段。在白酒企业信息化过程中，通过应用大数据、云计算等的新智慧营销方式，精准定位消费群体，将对中国白酒未来营销起到革命性作用…

人工智能 2023年6月1日
0090
【AI案例】（一）NPL文本情感分析

文章目录一、NLP文本情感分析概述二、文本情感分析难点三、具体方法与实现步骤 * 1、情感词典 2、高纬向量模型 – 1》概述 2》具体步骤如下： + 1） ji…

人工智能 2023年7月28日
0036
(‘You must install pydot (`pip install pydot`) and install graphviz…)

2022.07.16 * – + tf.keras.utils.plot_model + 解决方法 + 测试前言仅用来记录遇到的问题，方便之后出现类似问题后解决。此前…

人工智能 2023年6月25日
0077
RNN公式详细推导（结合广为流传的八位二进制加法代码）与代码详解

最近在查找RNN的公式详解中，发现大多数的公式都是一通链式求导结束，与网络上广为流传的八位二进制代码的计算过程完全不符，经过研究推导，觉得有必要给后来的同学推导一下代码中的计算过程…

人工智能 2023年7月14日
0072

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【python4 之 列与行：index 和列相互转化stack unstack，行列重命名，改变类别标签 , 对行、列重新排序； 用数据定义index/columns pivot 】

将列转化为category类型

大家都在看

【python4 之列与行：index 和列相互转化stack unstack，行列重命名，改变类别标签 , 对行、列重新排序；用数据定义index/columns pivot 】