数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（3）

2023年8月6日下午10:34 • Python • 阅读 70

文章目录

*
– 1.读取本的数据集
– 2.查看数据的前5行
– 3.将salary列的数据转换为最大值和最小值的平均值
– 4.将数据根据学历进行分组计算平均值
– 5.将createTime列转换为月日
– 6.查看所索引，数据类型和内存信息
– 7.查看数值型列的汇总统计
– 8.新增一列根据salary将数据分为三组
– 9.按照salary列队数据降序排序
– 10.取出第33行的数据

1.读取本的数据集


df = pd.read_excel('data1.xlsx')
df

2.查看数据的前5行

使用head()函数查看数据的前几行，可以传入具体的数，默认是5


df.head()

3.将salary列的数据转换为最大值和最小值的平均值

map和apply函数接受的参数都是一个行数，而且都不会直接改变原数据，都是返回一个新的DataFrame对象


def fun(x):
    a,b = x.split('-')
    a = int(a.strip('k'))*1000
    b = int(b.strip('k'))*1000
    return int((a+b)/2)
df['salary'].map(fun)

df['salary'] = df['salary'].apply(fun)
df

4.将数据根据学历进行分组计算平均值

使用groupby()函数进行分组


df.groupby('education').mean()

5.将createTime列转换为月日


for i in range(len(df)):
    df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')

df.head()

6.查看所索引，数据类型和内存信息

info()函数


df.info()

7.查看数值型列的汇总统计

describe() 返回的数据包括，数量，数据的平均值，标准差，最小值，最大值，25%、50% 75 % 的分位数


df.describe()

8.新增一列根据salary将数据分为三组


bins = [0,5000,20000,50000]
group_names = ['底','中','高']

df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df

9.按照salary列队数据降序排序

sort_values 默认是升序


df.sort_values('salary',ascending=False)

10.取出第33行的数据

根据索引选出第33行，索引从0开始


df.loc[32]

今天的10道题涉及的东西多了一些， groupby、 describe、 cut、 sort_values、 info等，如果想要全部的了解这些，仅靠这10道题是远远不够的，希望大家能够额外找些试题练习，也可以根据跟着博主的文章一块刷题✨✨✨

推荐使用牛客网进行练习直达牛客，快人一步

欢迎您的关注

Original: https://blog.csdn.net/qq_52007481/article/details/127559191
Author: 小鱼干儿♛
Title: 数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（3）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/738593/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python 三种方式实现截屏（详解+完整代码）

一、方法一 PIL中的ImageGrab模块使用PIL中的ImageGrab模块简单，但是效率有点低 PIL是Python Imaging Library，它为python解释器…

Python 2023年5月24日
0068
django框架学习操作简述（指令，文件内容，功能）

本文主要记录了django框架几个应用的场景，主要操作均为入门操作，包括django的创建项目启动项目的指令，创建使用APP，视图和URL，数据库ORM，静态文件 pip inst…

Python 2023年8月5日
0039
Flask-登录之falsk-login

背景 flask如何将部分页面鉴权后才能访问，笔者通过Flask-login实现，下面一起来看看是如何实现的吧。系统环境 win-11 python 3.8 依赖安装 pip i…

Python 2023年8月13日
0059
Python机器学习11——支持向量机

本系列所有的代码和数据都可以从陈强老师的个人主页上下载：Python数据程序参考书目：陈强.机器学习及Python应用. 北京：高等教育出版社, 2021. 本系列基本不讲数学原…

Python 2023年8月2日
0057
数据库范式

第一范式（1NF）：每列字段都是原子性的，不可分解； eg:用户信息表中地址信息编号姓名年龄地址1张三30重庆市xxx区xxx街道xxxx号1-1 针对地址列是不可分割的，但是如…

Python 2023年11月6日
0024
新零售SaaS架构：中央库存系统架构设计

近年来，越来越多的零售企业大力发展全渠道业务。在销售额增长上，通过线上的小程序、直播、平台渠道等方式，拓展流量变现渠道。在会员增长方面，通过多样的互动方式，全渠道触达消费者，扩大会…

Python 2023年10月19日
0063
计算机网络–概述

因特网概述网络、互联网、因特网因特网发展的三个阶段因特网的标准化工作因特网的组成互联网核心电路交换分组交换计算机网络性能计算机网络性能指标计算机网络体系结构 O…

Python 2023年6月3日
0093
瞧瞧别人家的API接口，那叫一个优雅

在实际工作中，我们需要经常跟第三方平台打交道，可能会对接第三方平台API接口，或者提供API接口给第三方平台调用。那么问题来了，如果设计一个优雅的API接口，能够满足：安全性、可…

Python 2023年8月30日
0057
解决 python 3.5 之后版本 lxml 无 etree 模块问题

其实python 3.5 之后的版本并不是没有了etree模块，而是将etree模块合并到了html模块，因此在使用etree模块时，需要先调用html模块。 from lxml …

Python 2023年6月15日
0056
python多进程map比apply快_python:map,apply,mapapply区别

apply:可作用与Series，也可以作用DataFrame 作用于Series *data CabinFareAge 0Acd7.829234.5 1Vafe7.000047….

Python 2023年8月22日
0047
python读取nc数据并绘图

使用python读取nc数据并绘图 * – 获取nc数据的相关信息 – 绘图 – + 用matplotlib绘图 + 用Basemap绘图 + …

Python 2023年8月2日
0049
Python 创建一个空的DataFrame，并按行写入数据

方法1 import pandas as pd df = pd.DataFrame(columns = [‘A’,’B’,’C’,’D’]) for i in range(4): …

Python 2023年8月19日
0040
python xlwings chart模块各种问题今天都遇到了

问题1、增加图表，按网上搜索的设置图表标题一直报错（pywintypes.com_error: (-2147352567, ‘发生意外。’, (0, &#8…

Python 2023年6月11日
0093
搭建Seata分布事务(基于Nacos注册+Mysql配置)

文章目录 * – 零：配置Seata数据库 – 一：拉取Seata镜像 – 二：运行Seata容器 – + 2.-2. 搭建Naco…

Python 2023年10月24日
0033
pandas astype、去重保留最大值；hive regexp_extract；pyspark agg、log、to_timestamp、unionByName

1、pandas astype 报错 Cannot convert non-finite values (NA or inf) to intege解决方法：去掉含有0和na的行 d…

Python 2023年8月16日
0042
Python3基础教程：return和yield的区别

一、说明 return一直中，每中语言中其没没有很大差别，就不多说了。（shell语言return的是退出状态，可能差别是比较大的）最早看到yield应该是哪们语言用来调整什么线…

Python 2023年11月2日
0036

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31