Python处理csv数据的技巧（pandas为主）

2023年8月7日上午5:28 • Python • 阅读 57

Pandas 在读取 csv 文件时时按块读取的，并不会一次性读取，并且对于数据的类型”都靠猜”，所以就可能出现了 Pandas 在不同块对同一列的数据”猜”出了不同的数据类型，也就造成了上述的警告。2 、3列为坐标，可能有些被认为是float 型，但是一些小数位过长的被认为是 str 型。

指定列的数据类型。 即可避免错误

 df=pd.read_csv("data.csv",sep=',',dtype={"Lat": str, "Lon": str})

创建空的DataFrame

创建以个空表格，并且指定了表头

df=pd.DataFrame(columns=['userid','Lat','Lon','time','month','num'])

也可以创建只设置index的空DataFrame

allwords=pd.DataFrame(index=a)

pandas切片指定的行和列

如下用iloc对表格切片，提取的是0-99列，0-541行的数据

df1=df.iloc[0:542,0:100]

pandas替代值

如下，用replace将表格中所有的” “替换为0

df=df.replace(' ',0)

读取和存储数据时，设置索引和表头

读取时，设置数据有无表头，否则默认第一列为表头，并且读取的时候应设置好编码，一般为’ansi’或’utf8′
存储为csv文件的时候也可以指定是否存储索引和表头

df =pd.read_csv("data.csv",encoding='ansi',header=None)
df.to_csv("data.csv",index=False,header=None)

转置

df=df.T

设置路径

代码过长时，应该在开头设置好path，方便后面再做第二次实验修改代码

path1 = "F:\城市事件探测\数据"
df =pd.read_csv(path1+"\\data.csv",encoding='ansi',header=None)

重命名表头

[]内按顺序设置新表头

df1.columns = ['正面']

.str.replace替代部分表头

df= df.rename(columns={'old': 'new'})

合并表格

axis设置按列还是按行合并

df=pd.concat([df1,df2],axis=1)

更改index

创建一个时间list，利用index方法修改df的索引

d=pd.date_range('20190101', '20200331',freq='D')
df.index=d

对df排序

针对df中columns为27的列，进行降序排序。
ascending控制降序还是升序

df=df.sort_values(by=27,ascending=False)

查找关键词

查找并返回在”text”列中，含有word关键词的行数据

df=df[df['text'].str.contains(word)]

spyder打不开

pip install -U spyder

Original: https://blog.csdn.net/xza13155/article/details/115055245
Author: 燕南路GISer
Title: Python处理csv数据的技巧（pandas为主）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/739267/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习—人工智能的第三次热潮

深度学习的历史趋势迄今为止深度学习已经经历了3次发展浪潮： 20世纪40年代到60年代，深度学习的雏形出现在控制论（cybernetics）中； 20世纪80年代到90年代，深度…

Python 2023年10月26日
0071
SpringCloud 网关 Gateway

哈喽~大家好，这篇来看看SpringCloud 网关 Gateway。 🥇个人主页：个人主页🥈 系列专栏：【微服务】🥉与这篇相关的文章： SpringCloud Sent…

Python 2023年10月10日
0033
jupyter notebook 无法切换内核，nb_conda无法安装等

记录下我辛苦一下午的坎坷经历，本人也是新手感谢其他作者的贡献，也希望分享经历能帮助其他人。以下是我的版本信息： anaconda版本：4.14.0 base环境下python版本：…

Python 2023年9月8日
0048
数据库实训课程设计( flask + swiftui + mysql ）

目录数据库实训课程设计（flask + swiftui + mysql） * GNTime – a game forum – 1. Project Overview …

Python 2023年8月12日
0051
如何优化PlantUML流程图（时序图）

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位🧡 Python实战微信订餐小程序 🧡 进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯…

Python 2023年8月13日
0055
手部21个关键点检测+手势识别-[MediaPipe]

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架，可以直接调用其API完成目标检测、人脸检测以及关键点检测等。本篇文章介绍其手部…

Python 2023年10月10日
0041
matplotlib之pyplot模块之标题（title()和suptitle()）

matplotlib 源码解析标题实现（窗口标题，标题，子图标题不同之间的差异）添加链接描述简单比较了 matplotlib中的标题。使用 title() 设置子图标题 titl…

Python 2023年9月1日
0078
python中的字符串操作

1.索引(下标) print(‘1.索引’) str_data = ‘Python’ [索引(下标)]取索引的格式正负索引获取单个数据 sub_str = str_data[4…

Python 2023年10月30日
0039
django搭建博客十博客首页

该系列文章 django搭建博客一前言django搭建博客二之初始化工程django搭建博客三初始化应用django搭建博客四页面布局和自定义异常视图django搭建博客五系统模型…

Python 2023年8月4日
0042
Python环境的安装（Anaconda+Jupyter notebook+Pycharm）

本文总结了Windows下Python环境的安装，包括Anaconda、Jupyter notebook和Pycharm的安装和基本使用技巧，方便初学者搭建Python环境。一、…

Python 2023年5月25日
0096
python中的screen blit_python pygame blit。获取要显示的图像

我想让我的摄像头通过pygame播放视频。代码如下：# import the relevant libraries import time import pygame import…

Python 2023年9月20日
0044
Streamlit(五) widgets-button

st.button / st.download_button st.button st.button(label, key=None, help=None, on_click=No…

Python 2023年8月16日
0057
查看python路径和版本、配置Conda环境和Pytorch安装

参考：获取python及三方包的版本,安装路径等信息 – 知乎 (zhihu.com) conda常用命令操作 – Eric小星 – 博客园 …

Python 2023年9月7日
0073
2021年度中职组“网络空间安全”赛项湖南省竞赛任务书

2021 年度中职组 “网络空间安全”赛项湖南省竞赛任务书一、竞赛时间 8:30-11:30，共计3小时。二、竞赛阶段竞赛阶段任务阶段竞赛…

Python 2023年11月6日
0035
python中stack函数_python pandas stack和unstack函数

在用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即”不要堆叠”，我对两个函数是这样理…

Python 2023年8月8日
0048
笔记7-Django框架之视图

添加图书通过get或者post请求方式将参数写入到数据库中，在views.py文件下编写视图函数 def add(request): if request.method == ‘…

Python 2023年8月5日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python处理csv数据的技巧（pandas为主）

目录

大家都在看