Pandas进阶操作(Dateframe交集，merge，去重，索引转换)

2023年7月6日下午6:01 • 人工智能 • 阅读 93

1.# 请将”_”处替换成能实现注释中功能的代码。

示例：

设置列表lst中位置3的值为1

lst_
根据注释中说明可知，此处”_”应替换成[3]=1,即有
lst[3]=1
请先将下面的代码复制到答题框，注意添加缩进

导入相关的包
import pandas as pd
import numpy as np
from numpy import nan as NA

def fact():
answer = []

df1 = pd.DataFrame({‘key’: [‘b’, ‘b’, ‘a’, ‘c’, ‘a’, ‘a’, ‘b’], ‘data1’: range(7)})
df2 = pd.DataFrame({‘key’: [‘a’, ‘b’, ‘d’], ‘data2’: range(3)})

指定key这一列取交集
dataframe1 = _

answer.append(dataframe1)

取df1和df2的交集
dataframe2 = _

answer.append(dataframe2)

取左连接，df1左连接df2
dataframe3 = _

answer.append(dataframe3)

df3 = pd.DataFrame({“lkey”: [“b”, “b”, “a”, “c”, “a”, “a”, “b”], “data1”: range(7)})
df4 = pd.DataFrame({“rkey”: [“a”, “b”, “d”], “data2”: range(3)})

取df3，df4的交集
dataframe4 = _

answer.append(dataframe4)

s1 = pd.Series([0, 1], index=[“a”, “b”])
s2 = pd.Series([2, 3, 4], index=[“c”, “d”, “e”])
s3 = pd.Series([5, 6], index=[“f”, “g”])

将多个Series拼接成一个DataFrame,即一个Series就是DataFrame的一列数据
dataframe5 = _

answer.append(dataframe5)

df5 = pd.DataFrame({“a”: [1, NA, 5, NA], “b”: [NA, 2, NA, 6], “c”: range(2, 18, 4)})
df6 = pd.DataFrame({“a”: [5, 4, NA, 3, 7], “b”: [NA, 3, 4, 6, 8]})

用df6的数据为df5中的数据打补丁
dataframe6 = _

answer.append(dataframe6)

data = pd.DataFrame(np.arange(6).reshape(2, 3), index=pd.Index([“上海”, “北京”], name=”省份”),
columns=pd.Index([2011, 2012, 2013], name=”年份”))
将data的列所引转换到行索引
result1 = _

answer.append(result1)

将result1的行索引转化为列索引
result2 = _

answer.append(result2)

将result1的行索引转化为列索引，指定要转化为层次化索引的名称为”省份”
result3 = _

answer.append(result3)

data1 = pd.DataFrame({“k1”: [“one”] * 3 + [“two”] * 4, “k2”: [1, 1, 2, 3, 3, 4, 4]})
使用DataFrame的内置函数去除重复数据，默认保留第一次出现的值
result4 = _

answer.append(result4)

return answer

&#x5BFC;&#x5165;&#x76F8;&#x5173;&#x7684;&#x5305;
import pandas as pd
import numpy as np
from numpy import nan as NA

def fact():
    answer = []

    df1 = pd.DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})
    df2 = pd.DataFrame({'key': ['a', 'b', 'd'], 'data2': range(3)})

&#x6307;&#x5B9A;key&#x8FD9;&#x4E00;&#x5217;&#x53D6;&#x4EA4;&#x96C6;
    dataframe1 =pd.merge(df1,df2,on='key')

    answer.append(dataframe1)

    # &#x53D6;df1&#x548C;df2&#x7684;&#x4EA4;&#x96C6;
    dataframe2 = pd.merge(df1,df2)

    answer.append(dataframe2)

    # &#x53D6;&#x5DE6;&#x8FDE;&#x63A5;&#xFF0C;df1&#x5DE6;&#x8FDE;&#x63A5;df2
    dataframe3 = pd.merge(df1,df2,how='left')

    answer.append(dataframe3)

    df3 = pd.DataFrame({"lkey": ["b", "b", "a", "c", "a", "a", "b"], "data1": range(7)})
    df4 = pd.DataFrame({"rkey": ["a", "b", "d"], "data2": range(3)})

    # &#x53D6;df3&#xFF0C;df4&#x7684;&#x4EA4;&#x96C6;
    dataframe4 = pd.merge(df3,df4,left_on='lkey',right_on='rkey')

    answer.append(dataframe4)

    s1 = pd.Series([0, 1], index=["a", "b"])
    s2 = pd.Series([2, 3, 4], index=["c", "d", "e"])
    s3 = pd.Series([5, 6], index=["f", "g"])

    # &#x5C06;&#x591A;&#x4E2A;Series&#x62FC;&#x63A5;&#x6210;&#x4E00;&#x4E2A;DataFrame,&#x5373;&#x4E00;&#x4E2A;Series&#x5C31;&#x662F;DataFrame&#x7684;&#x4E00;&#x5217;&#x6570;&#x636E;
    dataframe5 = pd.concat([s1,s2,s3],axis=1)

    answer.append(dataframe5)

    df5 = pd.DataFrame({"a": [1, NA, 5, NA], "b": [NA, 2, NA, 6], "c": range(2, 18, 4)})
    df6 = pd.DataFrame({"a": [5, 4, NA, 3, 7], "b": [NA, 3, 4, 6, 8]})

    # &#x7528;df6&#x7684;&#x6570;&#x636E;&#x4E3A;df5&#x4E2D;&#x7684;&#x6570;&#x636E;&#x6253;&#x8865;&#x4E01;
    dataframe6 = df5.combine_first(df6)

    answer.append(dataframe6)

    data = pd.DataFrame(np.arange(6).reshape(2, 3), index=pd.Index(["&#x4E0A;&#x6D77;", "&#x5317;&#x4EAC;"], name="&#x7701;&#x4EFD;"),
    columns=pd.Index([2011, 2012, 2013], name="&#x5E74;&#x4EFD;"))
    # &#x5C06;data&#x7684;&#x5217;&#x6240;&#x5F15;&#x8F6C;&#x6362;&#x5230;&#x884C;&#x7D22;&#x5F15;
    result1 = data.stack()

    answer.append(result1)

    # &#x5C06;result1&#x7684;&#x884C;&#x7D22;&#x5F15;&#x8F6C;&#x5316;&#x4E3A;&#x5217;&#x7D22;&#x5F15;
    result2 = result1.unstack()

    answer.append(result2)

    # &#x5C06;result1&#x7684;&#x884C;&#x7D22;&#x5F15;&#x8F6C;&#x5316;&#x4E3A;&#x5217;&#x7D22;&#x5F15;&#xFF0C;&#x6307;&#x5B9A;&#x8981;&#x8F6C;&#x5316;&#x4E3A;&#x5C42;&#x6B21;&#x5316;&#x7D22;&#x5F15;&#x7684;&#x540D;&#x79F0;&#x4E3A;"&#x7701;&#x4EFD;"
    result3 = result1.unstack(level='&#x7701;&#x4EFD;')

    answer.append(result3)

    data1 = pd.DataFrame({"k1": ["one"] * 3 + ["two"] * 4, "k2": [1, 1, 2, 3, 3, 4, 4]})
    # &#x4F7F;&#x7528;DataFrame&#x7684;&#x5185;&#x7F6E;&#x51FD;&#x6570;&#x53BB;&#x9664;&#x91CD;&#x590D;&#x6570;&#x636E;&#xFF0C;&#x9ED8;&#x8BA4;&#x4FDD;&#x7559;&#x7B2C;&#x4E00;&#x6B21;&#x51FA;&#x73B0;&#x7684;&#x503C;
    result4 = data1.drop_duplicates()

    answer.append(result4)

    return answer

水~~~~~~~~~~~~

Original: https://blog.csdn.net/m0_54361811/article/details/124431812
Author: Wizidomit
Title: Pandas进阶操作(Dateframe交集，merge，去重，索引转换)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674481/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【我的Android进阶之旅】使用MediaCodeC实现视频抽帧相关资料

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0081
利用pandas处理Excel文件各表单中的数据合为一个sheet

这里我们需用到python的两个库：xlrd，pandas.注：库中需安装有xlwt 第一步：安装库，安装代码:pip install xlrd, pip install pand…

人工智能 2023年7月8日
0072
（USB系列三）stm32 CubeMX usb音频描述符详解 usb audio UAC

如果您需要麦克风阵列，回声消除，声源定位，波束形成，语音对话产品，请访问我的好朋友的商店。 [En] If you need microphone array, echo canc…

人工智能 2023年5月25日
0083
十个 Python 小技巧，覆盖了90%的数据分析需求~

数据分析师日常工作会涉及各种任务，比如数据预处理、数据分析、机器学习模型创建、模型部署。 1、阅读数据集阅读数据是数据分析的组成部分，了解如何从不同的文件格式读取数据是数据分析师…

人工智能 2023年7月8日
0057
R 多元方差分析

当因变量（结果变量）不止一个时，可用多元方差分析（MANOVA）对它们同时进行分析。以MASS包中的UScereal数据集为例（Venables，Ripley（1999）），我们将…

人工智能 2023年6月18日
0078
自动驾驶中的多种卡尔曼滤波算法及推导详解，值得一读！

鉴于卡尔曼滤波算在多传感器融合系统中使用的普遍性，本文将单独就卡尔曼滤波算法及自动驾驶中常用的改进卡尔曼滤波算法进行详细介绍。首先介绍卡尔曼滤波的基本方法，然后介绍针对非线性系统…

人工智能 2023年6月16日
0089
读懂GSnet（一）：pandas读取pkl格式的多维数组，可视化理解时空数据

GSNet数据解读原始数据 * 1. all_data.pkl 2. risk_mask.pkl 3. risk_adj.pkl 4. road_adj.pkl 5. poi_a…

人工智能 2023年7月18日
0091
为什么相比于计算机视觉(cv)，自然语言处理(nlp)领域的发展要缓慢？

主要原因是涉及到序列的东西都不好做。CV那边搞视频一样头疼结果上不去。而且另外一方面，个人理解cv目前做的东西更多的是extraction和generation，understa…

人工智能 2023年5月27日
0072
Pandas表格美颜技巧

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 本文中主要介绍的是如何来美化Pandas的DataFrame的数据。主要是通过Pandas中的两个方法来…

人工智能 2023年7月8日
0078
[附源码]java毕业设计车辆违章信息管理系统

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月28日
0055
计算机网络总结笔记

文章目录 * – 三、网络层 – + 1、IPv4地址分类（32位） + * 1.1、IP分类 * 1.2、点分十进制记法 * 1.3、一般不使用的ip地址…

人工智能 2023年6月28日
0071
【Intel RealSense D455】Windows + yolo v5 6.0 环境搭建 & 目标检测深度测距的实现

硬件平台：windows10、NVIDIA GeForce GTX 1060 软件平台：Pycharm、Anaconda3、CUDA&cuDNN、pytorch 本篇博客实…

人工智能 2023年7月22日
00136
nn.Upsample

写在前面：在PyTorch中有两种上采样/下采样的方法，一种是Upsample，另一种是interpolate这两个函数的使用方法略有差异，这里仅介绍Upsample Upsamp…

人工智能 2023年7月21日
0058
【神经网络】一文带你轻松解析神经网络（附实例恶搞女友）

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将讲解关于神经网络的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉python网…

人工智能 2023年6月24日
0075
AttributeError: ‘SVC‘ object has no attribute ‘_probA‘

AttributeError: ‘SVC’ object has no attribute ‘_probA’ 问题： Save th…

人工智能 2023年7月18日
0065
【学术写作规范】论文写作注意事项

* – 1.结构的逻辑性 – + tips:在每个section使用总分总结构 – 2.语句的逻辑性 – 3.论证的逻辑性 &#82…

人工智能 2023年6月29日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pandas进阶操作(Dateframe交集，merge，去重，索引转换)

设置列表lst中位置3的值为1

大家都在看