实验十一 Pandas 库入门与进阶

2023年8月6日下午8:23 • Python • 阅读 47

1. 利用字典 data 和列表 labels 完成以下操作

data = {‘animal’:[‘cat’,’cat’,’snake’,’dog’,’dog’,’cat’,’snake’,’cat’,’dog’,’dog’],’age’: [2.5, 3, 0.5, np.nan, 5, 2, 4.5, np.nan, 7, 3],’visits’:[1,3,2,3,2,3,1,1,2,1],’priority’:[‘yes’,np.nan,’no’,’yes’,’no’,’no’,’no’,’yes’,’no’,’no’]}
labels = [‘a’,’b’,’c’,’d’,’e’,’f’,’g’,’h’,’i’,’j’]

(1) 创建 DataFrame 类型 df，效果如下图：

(2)输出 df 的前三行，并选择所有 visits 属性值大于 2 的所有行

(3)输出 df 缺失值所在的行，输出’age’与’animal’两列数据

(4) 输出 animal==cat 且 age

(5)计算 animal 列所有取值的出现的次数

(6)将 animal 列中所有 snake 替换为 tangyudi

(7)对 df 按列 animal 进行排序

(8)在 df 的在后一列后添加一列列名为 No.数据 0,1,2,3,4,5,6,7,8,9

(9)对 df 中的’visits’列求平均值以及乘积、和

(10)将 animal 对应的列中所有字符串字母变为大写

(11)利用浅复制方式创建 df 的副本 df2 并将其所有缺失值填充为 3

(12)利用浅复制方式创建 df 的副本 df3 并将其删除缺失值所在的行

(13)将 df 写入 animal.csv 文件

import pandas as pd
import numpy as np
data = {'animal':['cat','cat','snake','dog','dog','cat','snake','cat','dog','dog'],\
        'age': [2.5, 3, 0.5, np.nan, 5, 2, 4.5, np.nan, 7, 3],\
        'visits':[1,3,2,3,2,3,1,1,2,1],\
        'priority':['yes',np.nan,'no','yes','no','no','no','yes','no','no']}
labels = ['a','b','c','d','e','f','g','h','i','j']

df=pd.DataFrame(data,index=labels,columns=data)#创建 DataFrame 类型 df

#(1) 创建 DataFrame 类型 df,columns，index分别为指定行和列的索引值，列表类型
print(df)
print('\n')

###以下操作均改变原数组###

#(2)输出 df 的前三行，并选择所有 visits 属性值大于 2 的所有行
print(df.iloc[0:3])#输出前三行
print('\n')
print(df.loc[df['visits']>2]) #.loc[]行索引visits属性值大于2的行
print('\n')

#(3)输出 df 缺失值所在的行，输出'age'与'animal'两列数据
print(df[df.index.isnull()]) #df缺失值所在行
print('\n')
print(df[['age','animal']]) #输出age与animal两列数据
print('\n')

#(4) 输出 animal==cat 且 age

（13）将df写入animal.csv文件，如下图所示：

先占个坑以下题目回头再续

2.读取文件”haberman-kmes.dat”生成名为 dft 的 DataFrame，并进行如下操作：

(1) 列名为”Class”中取值分别将”negative”和”positive”替换为数字 0 和 1，并统计 0 和 1 各自出现的频数；
(2) 创建df的副本df2，其中df2为除了df最后一列之外的所有列；
(3) 将 df2 的每一列数据进行归一化处理，即

其中 x 为列中的任一数据，

，

分别为列中所有数据的最大值和最小值；
(4)计算 df2 行（样本或观测值）与行（样本或观测值）之间的欧式距离，并组成新的欧式距离数组 df3。
(5)将 df3 中所有的行中的数据从小到大的顺序进行排序

3.读取文件”adult.dat”生成名为 df 的 DataFrame，并进行如下操作：

(1) 删除该数据集中全部含有缺失值的行数据；
(2) 删除该数据集中重复的行数据；
(3) 按照 class 字段将该数据进行分组，并计算各组中列分别 age， Education-num，Capital-gain， Capital-loss 和 Hours-per-week 的均值和方差，并计算其余各列中不重复元素的个数以及所占的比例
(4) 将列 Age 字段取值划分为青年人(0-18)、中年人(19-45)、老年人 (45-100),并故根据该属性将该数据进行分组，然后计算各组中列分别 Education-num，Capital-gain， Capital-loss 和 Hours-per-week 的均值和方差，并计算其余各列中不重复元素的个数以及所占的比例。

Original: https://blog.csdn.net/qq_55793988/article/details/121775663
Author: 再见以前说再见
Title: 实验十一 Pandas 库入门与进阶

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/738355/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像处理及深度学习开源数据集大全（四万字呕心沥血整理）

13大类 150个图像处理和深度学习开源数据集 1. 目标检测（detection） 2. 人脸（face） 3. 文本识别（textg recongition） 4. 图像分类（…

Python 2023年9月30日
0091
Go语学习笔记 – 实现将mp4通过rtmp推送流媒体服务

目录前言环境代码总结前言最近研究golang音视频处理的时候，试着将mp4推送流媒体服务。下面分享一下代码，大家有需要可以研究一下，按照自己的需求改改。环境需要安装…

Python 2023年10月11日
0056
pygame 文字输入交互_布局未来人机交互核心，百度输入法AI技术展现不同内容

AI技术或许是工业4.0时代的核心，而AI概念自推出以来已历经多年，进步到底有多少？智能家居的大范围推广就是一个非常明显的印证，但是在所有硬件背后，必须要有最为核心的那一步，即人机…

Python 2023年9月25日
0043
Flask Web开发基础实战-1.1用户角色和权限管理

目录：前言：一，角色在数据库中的表示二，赋予角色三，角色验证四，相关代码模块 * 1.app/templates/403.html 2.app/main/errors.p…

Python 2023年8月13日
0047
20212218林思凡实验三《Python程序设计》实验报告

20212218 2021-2022-2 《Python程序设计》实验三报告课程：《Python程序设计》班级： 2122 姓名：林思凡学号：20212218 实验教师：王…

Python 2023年6月10日
0070
Python练习实例031

问题：请输入星期几的第一个字母来判断一下是星期几，如果第一个字母一样，则继续判断第二个字母。 #! /usr/bin/env python3 -*- coding:utf-8 -*…

Python 2023年6月11日
0057
FastAPI项目部署–nginx+gunicorn部署

在之前的分享中，FastAPI入门教程（持续更新中）的文章分享了Fastapi框架的入门和项目的实战，分享后，没有进行过部署，那么如何部署呢，今天带领大家去看下。部署选择了通用的…

Python 2023年6月15日
0083
问题|Conda虚拟环境创建出错Collecting package metadata (current_repodata.json): failed @Conda

目录问题描述解决方法 * 有效方法一有效方法二问题描述背景：近日在自己的电脑Windows10中进行Python开发环境搭建：在完成Miniconda、Pycharm、…

Python 2023年9月8日
0098
python 使用django库进行Web 开发(一)

django Web 开发简介Python Django 网站开发培训 – 2周入门 web后端开发 web服务端开发django 简介|菜鸟教程 1、Django 简…

Python 2023年8月4日
0055
Numpy、pandas基础（数据分析）

第4章 Numpy基础：数组与向量化计算 4.1 Numpy ndarray:多维数组对象 4.1.1 生成ndarray 4.1.2 ndarray的数据类型 4.1.3 Num…

Python 2023年8月25日
0047
Django搭配Editor.md上传图片问题解决方案

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年8月5日
0041
2021 年年度最佳开源软件

Svelte https://svelte.dev/ Svelte 是一种全新的构建用户界面的方法。传统框架如 React 和 Vue 在浏览器中需要做大量的工作，而 Svelte…

Python 2023年9月26日
0058
.NET7 gRPC JSON转码+OpenAPI

gRPC JSON转码 gRPC JSON 转码允许浏览器应用调用 gRPC 服务，就像它们是使用 JSON 的 RESTful API 一样。浏览器应用不需要生成 gRPC 客…

Python 2023年10月15日
0039
win10上Python Django的安装配置

1. 安装django pip install django 2. 配置环境变量安装完Django后，在Python根目录下的Scripts目录中，找到” djang…

Python 2023年8月5日
0034
python大作业高分项目–射击闯关游戏

项目功能：地图编辑器：可以实现玩家自己定义每一关卡的样式和难易程度运行界面：实现了玩家的移动，跳跃，发射子弹，投掷手雷，以及敌人的AL（移动，发射子弹，扔手雷），同时游戏中有一…

Python 2023年9月18日
0041
python 代码命名规范

1. 常量命名全部大写，多个单词由下划线分隔 [En] All in uppercase, with multiple words separated by underscore…

Python 2023年5月24日
0075

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

实验十一 Pandas 库入门与进阶

大家都在看