一、python中Numpy_Pandas数据处理基础

2023年8月7日上午8:41 • Python • 阅读 36

Numpy(Numerical Python) 是 Python语言的一个第三方库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。Numpy是一个运行速度非常快的数学库，主要用于数组计算。
Pandas是专门为处理表格和混杂数据设计的，相当于Python的Excel，而Numpy更适合处理统一的数组数据。

导包：

import pandas as pd
import numpy as np

1.将下面的字典创建为DataFrame

data = {"grammer":['python','c','java','go',np.NaN,'SQL','PHP','Python'],
        "score":[1.0, 2.0, np.NaN, 4.0, 5.0, 6.0, 7.0, 10.0]}
df = pd.DataFrame(data)
df

2.提取含有字符串”Python”的行


df[df['grammer'] == 'Python']

results = df['grammer'].str.contains('y')
results.fillna(value=False, inplace=True)
df[results]

3.输出df的所有列名

df.columns

4.修改第二列列名为’popularity’

df.rename(columns = {'score':'popularity'},inplace=True)
df

5.统计grammer列中每种编程语言出现的次数

df['grammer'].value_counts()

6.将空值用上下值的平均值填充

df['popularity'] = df['popularity'].fillna(df['popularity'].interpolate())
df

7.提取popularity列中值大于3的行

df[df['popularity'] > 3]

8.按照grammer列进行去除重复值

df.drop_duplicates(['grammer'])

9.计算popularity列平均值

df['popularity'].mean()

10.将grammer列转换为list

df['grammer'].to_list()

[‘Python’, ‘C’, ‘Java’, ‘GO’, nan, ‘SQL’, ‘PHP’, ‘Python’]

11.将DataFrame保存为CSV

df.to_csv('test.csv')

12.查看数据行列数

df.shape

13.提取popularity列值大于3小于7的行

df[(df['popularity'] > 3) & (df['popularity'] < 7)]

14.交换两列位置


temp = df['popularity']
df.drop(labels =['popularity'],axis=1,inplace=True)
df.insert(0,'popularity',temp)

cols = df.columns[[1,0]]
cols = df[cols]
df

练习题：
已知10位同学的学号以及语数英三科成绩如下：（都是数值型数据）
一、python中Numpy_Pandas数据处理基础

要求：计算出每位同学的总成绩(SumScore)、平均成绩(MeanScore)，最高成绩(MaxScore)、最低成绩(MinScore)、最高成绩与最低成绩的极差(PtpScore)、成绩方差(VarScore)；并将所有数据保存到score数据框中；将多列数据(包括学生的ID)合并到一列中，列名设置为answer，最终只保留索引id（从0到100）和answer两列，统一保留整数；
未优化代码：

import pandas as pd
data = {'Id':['202001','202002','202003','202004','202005','202006','202007','202008','202009','202010'],
        'Chinese':['98','67','84','88','78','90','93','75','82','87'],
        'Math':['92','80','73','76','88','78','90','82','77','69'],
        'English':['88','79','90','73','79','83','81','91','71','78'],}
df = pd.DataFrame(data).astype(int)
df['SumScore'] = df.apply(lambda x:x[1:4].sum(),axis=1).astype(int)
df['MeanScore'] = df.apply(lambda x:x[1:4].mean(),axis=1).astype(int)
df['MaxScore'] = df.apply(lambda x:x[1:4].max(),axis=1).astype(int)
df['MinScore'] = df.apply(lambda x:x[1:4].min(),axis=1).astype(int)
df['PtpScore'] = df.apply(lambda x:x[1:4].ptp(),axis=1).astype(int)
df['VarScore'] = df.apply(lambda x:x[1:4].var(),axis=1).astype(int)

df_result =  pd.DataFrame()
df_result = [['id','answer']]
df_result
data_result = pd.concat([df.iloc[:,0],df.iloc[:,1],df.iloc[:,2],df.iloc[:,3],df.iloc[:,4],df.iloc[:,5],
                        df.iloc[:,6],df.iloc[:,7],df.iloc[:,8],df.iloc[:,9]])
df_result = pd.DataFrame(data_result,columns=['answer'])
df_result['id'] = range(len(df_result))
df_result = df_result[['id','answer']]
df_result.to_csv('answer_1.csv', index=False, encoding='utf-8-sig')
df_result

优化代码：


import pandas as pd
data = {'Id':['202001','202002','202003','202004','202005','202006','202007','202008','202009','202010'],
        'Chinese':['98','67','84','88','78','90','93','75','82','87'],
        'Math':['92','80','73','76','88','78','90','82','77','69'],
        'English':['88','79','90','73','79','83','81','91','71','78'],}
df = pd.DataFrame(data).astype(int)

tmp = df[['Chinese','Math','English']].agg(['sum','mean','max','min','ptp','var'],axis=1).astype(int)
tmp.rename(columns={'sum':'SumScore','mean':'MeanScore','max':'MaxScore','min':'MinScore','ptp':'PtpScore','var':'VarScore'},inplace=True)

df = pd.concat([df,tmp],axis=1)

data_result = pd.concat([df.iloc[:,i] for i in range(10)])

df_result = pd.DataFrame(data_result,columns=['answer'])
df_result['id'] = range(len(df_result))
df_result = df_result[['id','answer']]
df_result.to_csv('answer_1.csv', index=False, encoding='utf-8-sig')

中间图片：

结果图片：

学习链接：https://www.heywhale.com/home/activity/detail/6154198bc270e400182b11f9

Original: https://blog.csdn.net/Hexiaolian123/article/details/122549259
Author: 酸菜鱼摆摆
Title: 一、python中Numpy_Pandas数据处理基础

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/739577/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pygame实现飞机大战－第三版－仿写版

目录一、功能介绍：二、原代码（一）精灵定义部分（二）游戏运行部分三、代码解析（一）游戏开始界面的实现（二）双人单人游戏控制（三）利用自定义事件（四）利用精灵Spr…

Python 2023年9月24日
0028
Python采集1000多所世界大学排名数据，制作可视化图

前言 QS世界大学排名（QS World University Rankings）是由英国一家国际教育市场咨询公司Quacquarelli Symonds（简称QS）所发表的年度世…

Python 2023年11月2日
0047
Django开发框架详细入门教程之实现接口并测试

本文将介绍django框架的基本入门使用，下载安装，及实现一个简单的get请求接口和post请求接口，及利用postman和apipost工具进行测试。一、django介绍前段…

Python 2023年8月13日
0066
使用nginx配置静态页面展示sphinx-doc

文章目录 1. 安装nginx 2. 设置静态页面请求 3. 遇到问题的分析 * 1. 网页 403 Forbidden 2. 网页 404 Not Found 系统: Ubunt…

Python 2023年8月5日
0035
基于Python构建机器学习Web应用

目录一、内容介绍 1.Onnx模型 ①skl2onnx库安装 2.Netron安装二、模型构建 1.数据加载 2.划分可训练特征与预测标签 3.训练模型 ①第三方库导入 ②数据…

Python 2023年9月29日
0037
request.files.getlist

from flask import Flask, request uploaded_files = request.files.getlist("fileList&quo…

Python 2023年8月10日
0045
Docker-compose命令及配置文件讲解

Docker-compose 是用于定义和运行多容器 Docker 应用程序的编排工具。使用 docker-compose 后不再需要逐一创建和启动容器。您可以使用 YML 文件来…

Python 2023年8月14日
00125
30张炫酷的动态交互式图表，Python 一键即可生成

今天我来讲一下如何用 Python 一行代码在 DataFrame数据集当中生成炫酷的动态交互式的图表，本文中我们需要用到的模块 cufflinks ，就像是 seaborn封装了…

Python 2023年8月22日
0047
过年啦，用Python实现雪夜烟花景

运行截图运行效果：什么？你说你看不清烟花？那我换一种颜色，请点开看。 ; 实现过程准备工作使用语言和框架：python、pygame。安装pygame: pip insta…

Python 2023年9月18日
0062
玩 ChatGPT 的正确姿势「GitHub 热点速览 v.22.49」

作者：HelloGitHub-小鱼干火了一周的 ChatGPT，HG 不允许还有小伙伴不知道这个东西是什么？简单来说就是，你可以让它扮演任何事物，据说已经有人用它开始了颜色文学创…

Python 2023年11月4日
0045
爬虫五（Scrapy框架整体流程介绍、Scrapy解析数据爬取Cnblogs文章信息、Settings相关配置提高爬取效率、持久化方案保存到本地数据库、爬虫中间件）

文章目录一、Scrapy架构流程介绍二、Scrapy解析数据（爬取Cnblogs文章信息）三、Settings相关配置提高爬取效率四、持久化方案五、爬虫中间件一、Scr…

Python 2023年10月3日
0050
mysql使用group by查询报错SELECT list is not in GROUP BY clause and contains nonaggregated column…原因及解决方案

在项目中需要用到group by进行聚合计算，在计算的同时也要查出一些其他字段来返回给前端。于是就有了这个错误的出现。先简单复现我所写的sql，其实sql非常简单。 select…

Python 2023年5月24日
0090
python 一维数组变为二维数组

[python 二维数组变三维数组 python 二维数组变一维数组 pp = [[11,22,33],[111,44,55],[77,88,99]]将二维列表转为一维列表1、方法…

Python 2023年5月25日
0066
【4天快速入门Python数据挖掘之第1天】Matplotlib的使用

🔥一个人走得远了，就会忘记自己为了什么而出发，希望你可以不忘初心，不要随波逐流，一直走下去🎶🦋 欢迎关注🖱点赞👍收藏🌟留言🐾🦄 本文由程序喵正在路上原创，CSDN首发！💖 系列…

Python 2023年8月30日
0049
安装PyTorch详细过程

安装PyTorch过程安装anaconda 环境管理 PyTorch安装检验安装安装anaconda 登录anaconda的官网下载，anaconda是一个集成的工具软件不需…

Python 2023年8月1日
0031
小波变换中的多贝西小波（DB小波函数）概述

内容均来源于维基百科对db小波函数的介绍多贝西小波（英语：Daubechies Wavelet），是以比利时女性物理暨数学家英格丽·多贝西（Ingrid Daubechies）的…

Python 2023年10月27日
0022

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

一、python中Numpy_Pandas数据处理基础

大家都在看