数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（2）

2023年8月16日上午3:29 • Python • 阅读 85

文章目录

*
– 前期准备
– 1.通过DataFrame保存为EXCEL
– 2.查看数据行列数
– 3.提取popularity列中值大于3小于7的行
– 4.交换两列的位置
– 5.提取popularity列最大的行所在行
– 6.查看最后3行数据
– 7.删除最后一行数据
– 8.添加一行数据
– 9.队数据按照popularity列的值的大小进行排序
– 10.统计grammer列每个字符串的长度

前期准备

准备后期要使用的数据，使用字典创建DataFrame对象

import pandas as pd
import numpy as np
data = {
    'grammer':['python','java','go',np.nan,'python','C','C++'],
    'popularity':[1,np.nan,np.nan,4,5,7,8]
}
df = pd.DataFrame(data)
df

1.通过DataFrame保存为EXCEL

保存文件的函数一般是 to_xxx


df.to_excel('text.xlsx')

df.to_csv('text.csv')

2.查看数据行列数

通过DataFrame的对象的属性查看数据行列数
也可以通过其他的方式进行查询，但是这种是最便捷的


df.shape

3.提取popularity列中值大于3小于7的行

使用的是布尔值索引还有进行合取操作

df[(df['popularity']>3) & (df['popularity']<7)]

4.交换两列的位置

其实这个交换位置，内在的逻辑就是先取出交换后的数据，再将交换后的数据重新赋值给 df

df = df[['popularity','grammer']]
df

5.提取popularity列最大的行所在行

使用到了 max函数同样还有 min函数，
使用这个方法避免了数据中出现两个最大值而而只取出一个的情况。

df[df['popularity']== df['popularity'].max()]

6.查看最后3行数据

使用的是tail()函数，默认是最后5行，在括号里面传入 X就会返回最后 X条
同样还用head() 用法是一样的


df.tail(3)

7.删除最后一行数据

主要的思路是选中最后一行，然后删除，这种方式还可以删除多行


df.drop([len(df)-1],inplace=True)

df.drop([df.shape[0]-1],inplace=True)
df

8.添加一行数据

append() 添加数据，使用字典添加，字典的键是列名，值是要添加的数据,如果字典的键在DataFrame
中不存在，则会新建一列，其余的行设置为 NaN

row = {'grammer':'Perl','popularity':6.6}
df.append(row,ignore_index=True)

9.队数据按照popularity列的值的大小进行排序

使用sort_values函数，按值排序，默认是升序添加参数 ascending=False可以变为降序

df.sort_values('popularity')
df.sort_values('popularity',inplace=True)

10.统计grammer列每个字符串的长度

因为计算字符的长度，不能为 NaN不然会报错，所以我们在计算字符串的长度的时候可以选择先将孔空缺的数据填充上去，然后在计算长度

df['grammer'] = df['grammer'].fillna("R")　　　

df['len_str'] = df['grammer'].map(len)
df

今天这10道题还是比较轻松的，希望大家能够多多拓展，拓宽自己的思路，尝试一些新的方法。
这里我推荐大家去 牛客网 继续练习，牛客网里面有相应题目的专项突破

Original: https://blog.csdn.net/qq_52007481/article/details/127497748
Author: 小鱼干儿♛
Title: 数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（2）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/750775/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python-量化交易-2-pandas数据读取

读取数据到一个数据框架中，dataframe = pd.read_csv(file_path,index_col = [‘交易日期’],error_bad_…

Python 2023年8月9日
0041
【Pandas map(),apply(),applymap()用法详解】

目录一、map()函数 1.map() 参数为字典； 2.map() 参数为内置函数； 3.map() 参数定义为自定义函数； 4.map() 参数为lambda匿名函数；二、…

Python 2023年8月18日
0044
学习Pandas（二）

目录复习Series结构 * 一、Series结构创建二、Series的索引/切片三、Series数据结构基本技巧新内容：DataFrame数据类型 * 一、创建Data…

Python 2023年8月9日
0065
python—获取元素 Xpath

python—获取元素 Xpath 原创夕陌2022-07-19 11:27:10©著作权文章标签绝对路径 firefox 元素定位文章分类 Python 后端…

Python 2023年5月25日
0081
python3 之循环（for循环，list 简化，iterrows， enumerate ）

1、 For 循环基本用法将所有的数据输出： res=[] res=pd.DataFrame() 【如果是矩阵】 for i in … #循环处理文档的每一行 &#8…

Python 2023年8月19日
0069
【愚公系列】2022年04月 Python教学课程 76-DRF框架之分页

文章目录一、分页 * 1.全局设置分页二、PageNumberPagination * 1.属性说明三、LimitOffsetPagination * 1.属性说明四、Cu…

Python 2023年8月4日
0047
关于国产麒麟系统上长时间运行Qt程序.xsession-erros文件占满磁盘导致无法写入的解决方法

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/128660728 红胖子(红模仿)的博…

Python 2023年11月8日
0070
2022 star*CTF-Writeup

2022 star*CTF-Writeup by EDI Web * oh-my-lotto oh-my-lotto-revenge oh-my-notepro oh-my-gra…

Python 2023年8月12日
0052
python任务队列 http_Flask例子-实现Redis Task Queue（任务队列）

Python部落组织翻译，禁止转载，欢迎转发在本文中，我们加入基础的 Redis task queue来进行文本处理。有许多的工具也能够实现，例如ReTask和HotQueue…

Python 2023年8月15日
0052
数据结构——链表

1.什么是链表链表是一种物理存储结构上非连续、非顺序的存储结构，数据元素的逻辑顺序是通过链表中的指针链接次序实现的。 2.节点节点维护变量data和next，分别用于存储数据和…

Python 2023年6月12日
0093
python中数组array和列表list的基本用法及区别

1. 定义（1）数组array: 是同类型数据的有限集合（2）列表list: 是一系列按特定顺序排列的元素组成，可以将任何数据放入列表，且其中元素之间没有任何关系。 2. 两者不…

Python 2023年8月23日
0043
python编制应用程序错误_python – opencv / macports应用程序的py2app错误。如何使用headerpad_max_install_names标志编译opencv？ – …

我正在尝试使用opencv和pygame构建一个应用程序。这两个库已经安装了macports。我还在macports python中安装了py2app。我正在运行一个简单的p…

Python 2023年9月25日
0038
你不知道的CS模式的进程管理工具，状态监测、项目启停一目了然！

（摘自百度百科）Supervisor是用Python开发的一套通用的进程管理程序，能将一个普通的命令行进程变为后台daemon，并监控进程状态，异常退出时能自动重启。它是通过for…

Python 2023年5月25日
00108
unittest 和 pytest 的区别

一、用例编写规则 1、unittest提供了test_cases、test_suites、test_fixtures、test_runner相关的类，让测试更加明确、方便、可控，使…

Python 2023年9月12日
0052
pytest中参数化方法,并且根据执行的命令进行动态参数化

pytest.mark.parametrize可以实现参数化，它包含的参数有： argnames:一个或者多各参数名，逗号分割 argvalues:和argnames对应，若arg…

Python 2023年9月10日
0041
np.array与np.float32

import numpy as np matsrc = np.float32([[220, 40], [190, 164], [446, 37], [460, 160]]) mat…

Python 2023年8月26日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31