Coursera上UM的Applied Python课学习记录（1）

2023年7月7日上午2:09 • 人工智能 • 阅读 69

课上的老师推荐的Pandas原说明文件 https://pandas.pydata.org/pandas-docs/stable/pandas.pdf
（pp.31后都和这节课的dataframe, series操作有关）

作业一共十三题，每一题大概对应不同的Pandas功能或数据分析/清理需求

小白供自己整理学习，如有误导谬误之处请指证！感谢

第1题）基本操作：

读取外部文件read

分隔信息sep

只取表格中的个别列usecols

设置空值na_values

给表格里的列命名names

替换单元格的值replace

按照某一列排序sort

合并多个数据框架merge

题目要求：

a) 导入三个能源与GDP相关的不同类型的表格，按照要求命名 (pp.105-108)

可见Pandas说明文件pp.104-105读取csv文件，pp.362-362关于excel文件读取的解释

name_of_dataframe1 = pd.read_excel('file_name.xls') #read_excel 可以读 xls,xlsx 文件
name_of_dataframe2 = pd.read_csv('file_name.xls') #read_csv 可以读 csv 文件

*额外截图：关于不同文件的读取对照（pp.287）

根据文档pp.288，Pandas似乎只对csv文档有default分隔符的处理。

当我们需要对excel文档进行可以采用的是对sep/delimeter进行设置。可以采取的符号有’,’ , ‘\s’

name_of_dataframe_1 = pd.read_excel('file_name.xls',
                                     sep = ',')

c) 将表格的前两列去除（不读前两列）

根据文档pp.298, 使用usecols. 不是非常清楚这里是否要删除前两列空列.

usecols不能用’:’选取某行以前或以后的，只能一个一个写出来

*参考了这位大哥/小姐姐的文章[Coursera | Introduction to Data Science in Python] Assignment 3 – More Pandas_jiaoyiru的博客-CSDN博客

name_of_dataframe1 = pd.read_excel('file_name.xls',
                                    sep = ',',
                                    usecols = [2,3,4,5,6,...]) #应该也可以写作usecols=lambda x: x not in ["a", "c"])

d) 将表格里”…”的单元格都转化为np.nan 空值

pandas default会把某些表达默认为是空值，但是如果需要自动设置空值，可以使用na_values

name_of_dataframe1 = pd.read_excel('file_name.xls',
                                    sep = ',',
                                    na_values = '...',
                                    usecols = [2,3,4,5,6])

e) 将采用的列根据需求重新命名（在题目里只需要给原本没有的赋予名称，不过也可以了解一下重新命名列的写法）

pp.151 重命名column的方法(注意是method而不是直接=)

dataframe.rename(columns={"original_name": "rename_name"})

pp.1037 解释了在导入时备注name的方法*如果不需要命名可以使用header = 0来override

name_of_dataframe = pd.read_excel('file_name.xls',
                                   sep = ',',
                                   na_values='...',
                                   usecols = [2,3,4,5,6],
                                   names=['Column1','Column2','Column3'])

f) 替换cell内的值

pp.75 写到了replace() method. 这个方法需要使用dict字典的形式来定义需要转换的和转换成为的字符 It requires a dictionary to define the mapping {from : to}.

name_of_dataframe["use_new_column_or_use_old"] = dataframe["original_column"].replace({"original_value1": "new_value1", "original_value2": "new_value2"})

g) merge不同的表格（数据框架）

pp.50-51 介绍了把两个表合并的案例

New_Dataframe = pd.merge(df1, df2, how="left", on="index_column") #how这一部分可以写outer,inner,left,right

h) 根据某一行排序sort_values()

*参考了这位大哥/小姐姐的文章

python pandas sort_values()方法的使用_python小工具的博客-CSDN博客_python sort_values

排序的不同方式：

*关于是否要使用by=来指定排序的根据，我没有找到很好的答案。

df.sort_values(['col1'], inplace = True)
df.sort_values(['col1', 'col2'])
df.sort_values('col1', ascending=False) #降序排列
df.sort_values(by="col1")

Original: https://blog.csdn.net/weixin_47352404/article/details/122492771
Author: 大姚同学
Title: Coursera上UM的Applied Python课学习记录（1）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/675259/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于Python+Open CV的手势识别算法设计

素材资料下载：目录 1. 课题背景及分析 2. 算法设计 3. 算法实现与调试 4. 实验结果及分析 5. 今后研究及改进计划 6. 设计总结 7. 主要参考书目 8. 附件 1…

人工智能 2023年6月17日
0080
opencv-黑马程序员—Chapter1 opecv简介

Introduction 课程内容 1.opencv简介主要内容 1.1 图像处理简介 1.2 OpenCV简介 1.3 OpenCV的模块 Introduction 本课程是从…

人工智能 2023年7月19日
0038
DeepFM详细流程解析及建模演示

· 流程解析关于DeepFM理论的说明，很多博客或论文已有说明，这里就不再赘述。下面主要是说一下模型如何使用以及在整个过程中，算法对数据做了些什么事。首先还是这张图：乍一看…

人工智能 2023年5月25日
00116
知识图谱构建全流程

一、知识图谱简介知识图谱，是结构化的语义知识库，用于迅速描述物理世界中的概念及其相互关系，通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识，使信息资源更易于计算、理解…

人工智能 2023年6月10日
0085
PyTorch实现MNIST数据集手写数字识别

本篇文章基于卷积神经网络CNN，使用PyTorch实现MNIST数据集手写数字识别。 PyTorch 是一个 Torch7 团队开源的 Python 优先的深度学习框架，提供两个高…

人工智能 2023年7月21日
0069
1、缺失值处理：暴力删除、直接转换、简单插补法

在生成、采集、计算过程中被遗漏的数据信息，被称为缺失值；并不是表现为缺失状态的值就一定是缺失值，需要根据简单业务逻辑推断。在对缺失数据进行处理前，了解数据缺失的类型十分必要。完…

人工智能 2023年7月14日
0052
Python+OpenCV人脸识别，训练模型

1.引入库代码如下（示例）： import cv2 as cv import os import numpy as np from PIL import Image 2.读入数据…

人工智能 2023年7月19日
0076
高斯过程回归（输出学习法！）

Gaussian Process Regression 概述 * 多元高斯分布的定义高斯过程一、Weight-space View * 1.1 标准贝叶斯线性模型 1.2 Fe…

人工智能 2023年6月18日
0074
Deep Learning 记录：预测房价——回归问题（House Prices – Advanced Regression Techniques）

文章目录一、环境配置说明 * 1.使用Anaconda作为python环境管理 2.虚拟环境介绍二、数据集介绍与可视化展示 * 1.数据集介绍 2.可视化展示三、数据处理与说…

人工智能 2023年6月17日
0064
图像几何校正

; 几何校正中混淆的概念名词描述几何校正几何畸变会给基于遥感图像的定量分析、变化检测、图像融合、地图测量或更新等处理带来误差（主要指二维平面坐标），所以需要针对图像的几何畸变进…

人工智能 2023年6月25日
0072
搭建自己的语义分割平台deeplabV3+

文章目录前言一、deeplabV3+ 二、数据准备三、修改代码四、开始训练五、测试前言在上一篇主要了解了语义分割，实例分割，全景分割的区别，以及labelme标注的数…

人工智能 2023年6月23日
0078
R语言为dataframe添加新的数据列（横向拼接、Appending columns，Unioning columns）:使用R原生方法、data.table、dplyr等方案

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月16日
0055
图像识别6：综合

图像识别6：综合一、图像数据的提取二、特征提取三、划分数据集并分类 * 3.1决策树 3.2 SVM 3.3 knn 四、可视化五、结果展示 * 1. 对resize前后的…

人工智能 2023年7月2日
0051
python 手眼标定OpenCV手眼标定（calibrateHandeye()）二

这一章我们来根据上一章的分析，为手眼标定函数calibrateHandEye 准备他那些麻烦的参数更详细的参数参考链接 R,T=cv2.calibrateHandEye(R_all…

人工智能 2023年7月19日
00105
yolov5/yolov3训练自己的数据集（超详细，细的有点烦）

YOLO系列是非常优秀的物体检测框架，目前总共有V1-V5五个版本。本博客的目的在于教大家如何使用YOLOv5训练自己的数据，重点在于应用。有关原理我会在后面的博客中详细介绍。使用…

人工智能 2023年5月25日
0086
3D人体骨架检测（mediapipe）

在本教程中，我们将学习如何使用python中的mediapipe库进行实时3D骨架检测。首先，我们得用pip下载下来我们需要用到的模组： pip install mediapip…

人工智能 2023年6月18日
0064

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30