Python Pandas读取文件和DataFrame、Series的基本使用

2023年8月19日上午9:56 • Python • 阅读 65

1.读取文件和数据属性的基本查看方法

数据类型读取方法csv,tsv,txtpd.read_csv(filepath)excelpd.read_excel(filepath)mysqlpd.read_sql(filepath)

注意，读取mysql时，要先进行sql连接

import pymysql
conn = pymysql.connect(
    host="127.0.0.1"
    user="root"
    password="123456"
    database="data_info"
    charset="utf8"
    )
mysql_info=pd.read_sql("select * from information",con=conn)

其他一些查看表属性的基本操作

improt pandas as pd
filepath="./information.txt"
info = pd.read_csv(filepath,sep=",",header=None,names=["column_A","column_B","column_C"],skiprows=2)

info.head()
info.shape
info.columns
info.index

2.DataFrame和Series

如上图，一整张表就是一个DataFrame,即DataFrame是一个二维数组。PV一整列就称为是一个Series，2019/9/3的一整行数据也称为一个Series，即Series是一个一维数组。

; 一.Series

（1）创建Series


s1 = pd.Series([1, 2, 3, 4])

s2  = pd.Series(np.arange(7))

s3 = pd.Series({'one':1, 'two':2, 'three':3})

（2）Series的常用操作

例如s3是上面的一组Series数据，其中第一列表示索引，第二列是数据值

"""方式二（推荐）"""
s3.loc["java"]
s3.loc["c","python"]
s3.loc[0]
s3.loc["php":"h5"]

二.DataFrame

（1）创建DataFrame


fruits_dict = { 'Fruits':['Apple','Banana','Cherry','Dates','Eggfruit'],
                'Quantity': [5, 10, 8, 3, 7],
               }

pd.DataFrame(data=[['Apple',5],
                   ['Banana',10],
                   ['Cherry',8],
                   ['Dates',3],
                   ['Eggfruit',7]],
             columns = ['Fruits','Quantity'],
             index=[1,2,3,4,5])

（2）设置索引

例如s3是上面的一个文件数据，行默认是按照0-4进行索引，若要设置成按照ymd属性的值进行索引，表示如下：

info.set_index("ymd",inplace=True，drop=True)

（3）替换操作


s3.loc[:,"bWendu"] = s3["bWendu"].str.replace("℃","").astype("int32")
s3.loc[:,"yWendu"] = s3["yWendu"].str.replace("℃","").astype("int32")

（3）常用操作


s3.loc["2018-01-03","bWendu"]

s3.loc["2018-01-03",["bWendu","yWendu"]]

s3.loc[["2018-01-03","2018-01-04"],"bWendu"]

s3.loc[["2018-01-03","2018-01-05"],["bWendu","yWendu"]

s3.loc[s3["yWendu"]<10,:]

s3.loc[lambda s3:(s3["bWendu"]30) &&(s3["yWendu"]>=10),: ]

Original: https://blog.csdn.net/weixin_48826751/article/details/123762097
Author: weixin_48826751
Title: Python Pandas读取文件和DataFrame、Series的基本使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753841/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python中pygame库的功能_基于Python的PyGame库实现的贪吃蛇小游戏

1 项目介绍 1.1 简介键盘上下左右控制蛇的前进方向，每吃到一个食物，蛇的长度增加一个单位，并生成一个新的食物，得分scores加一；当蛇撞到边界或自己时，游戏结束。时间tim…

Python 2023年9月24日
0049
Linux下一键安装Python3&更改镜像源&虚拟环境管理技巧

前言之前分享过一篇《Linux系统自带Python2&yum的卸载及重装;》，介绍了如何卸载及重装Linux(CentOS)自带的的Python2.7。今天主要介绍如何在…

Python 2023年11月1日
0034
【python绘图】Matplotlib绘图及设置（使用python制图）

目录一、初识matplotlib.pyplot 1.绘制图像 2.设置图片大小 3.保存图片文件 4.设置X，Y轴刻度范围自定义刻度内容 5.添加描述信息（标题、轴标签） 6….

Python 2023年9月7日
0076
python3.9.0a2安装pygame_安装错误Pygame（3.9）安装（Win10）

Good morning, I have a hellish problem, recently I learned to learn python so I still don&…

Python 2023年9月23日
0054
腾讯会议使用OBS虚拟摄像头

1.进入官网下载OBS stdio Open Broadcaster Software | OBS (obsproject.com) 2.下载一个插件,拓展OBS的虚拟摄像头功能 …

Python 2023年10月9日
00157
谈谈我的「数字文具盒」 – NextCloud

接下来两篇主要谈论 Nextcloud 和 Obsidian，因为篇幅较长，所以单出罗列出来。本文主要介绍 Nextcloud 以及使用中的技巧和心得体会。 Nextcloud N…

Python 2023年10月13日
0047
Flask学习与项目实战1：介绍、创建项目、配置讲解

Flask的优点 1、微框架、简洁、扩展性高。2、相应的插件非常好，可用性很高。3、开发效率很高，例如SQLAlchemy的ORM操作数据库可以节省开发者大量书写sql的时间。4、…

Python 2023年8月14日
0062
python自动化办公（十七）Filedialog控件：语法及其参数、demos

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年9月22日
0043
单元测试界的高富帅，Pytest框架，用例标记和测试执行怎么做

一、pytest 中内置的标记 pytest 标记使用需要通过 pytest.mark.标记来使用，pytest 中为应对各种测试场景也内置了很多的标记。 1.1、pytest….

Python 2023年9月12日
0036
Python数据分析常用包-pandas

读者需知：本文为个人实践过程中的总结记录，当中有未知变量名为当时实践时使用。以numpy为基础，基于matplotlib可以简单画图。数据处理能力强三大数据结构 Se…

Python 2023年8月8日
0040
【Python】np.unique() 介绍与使用

文章目录一、np.unique() 介绍二、np.unique() 原型三、实例参考链接一、np.unique() 介绍对于一维数组或者列表，np.unique() 函…

Python 2023年8月1日
0098
Python之Pandas isnull检查是否有缺失值

1.df.isnull() 元素级别的判断，把对应的所有元素的位置都列出来，元素为空或者NA就显示True，否则就是False train.isnull() 2,df.isnull…

Python 2023年8月19日
0075
如何使用BeanUtils+lombok复制对象

java 开发中，为了复制一个独立的对象，不能直接用 = 赋值，那样只是引用了对象的地址。而应该 new 一个全新的对象，但是把其参数设置为与一个已有对象完全一样是困难的，因为对象…

Python 2023年11月6日
0029
python图论库_Python 图论工具

networkx：一个用Python语言开发的图论与复杂网络建模工具，内置了常用的图与复杂网络分析算法，可以方便的进行复杂网络数据分析、仿真建模等工作。依赖工具： nump…

Python 2023年9月6日
0069
cs231n作业-assignment1

assignment 1 (cs231n) 文章目录 assignment 1 (cs231n) * KNN基础 – 计算distances 方法一：双层循环计算di…

Python 2023年8月28日
0078
Python-matplotlib制图08-在特定位置添加新的x轴和y轴

锻炼好自己的身心素质，然后拼了命做好自己要做的事情。目录前言 * 1. 概述 2. 版本 – 2.1 山东青岛，2021年5月13日，Version 1 3. 参考…

Python 2023年9月6日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python Pandas读取文件和DataFrame、Series的基本使用

1.读取文件和数据属性的基本查看方法

2.DataFrame和Series

; 一.Series

二.DataFrame

大家都在看