python + pandas数据储存

2023年8月19日上午6:24 • Python • 阅读 60

数据结构

Series对象创建一维数组的对象


s1 = pandas.Series([1, 2, 3, 4])

s2 = pandas.Series([1,2,3],index=['a','b','c'])
s3 =pandas.Series({'a':1,'b':2})

返回值

a    1
b    2
c    3
dtype: int64

DataFrame对象二维数组对象


s1 = pandas.DataFrame([['student1',12,89],
                        ['student2',21,90]],
                      index=['001','002'],
                      columns=['name','age','score'])

返回值

         name  age  score
001  student1   12     89
002  student2   21      0

读取数据 ——Excel表格

使用read_excel

excel = pandas.read_excel('工作簿1.xlsx',
                          sheet_name=0,
                          engine='xlrd')

默认引擎是xlrd，使用时需要安装xlrd，此外还需要安装openpyxl模块。

sheet_name=0,表示读取第一个工作表。也可使用具体表名。

指定读取数据的行、列标签

使用参数header和index_col

赋值为0时：自带的列标签没有了

none：没有改变

赋值为1：产品、金额表头没有了

赋值为2以此类推

使用index_col解决行标签同理

; 读取指定列

usecols=[2，3] 只读取第3，4列

读取前几行

使用head方法，默认是前5行

excel = pandas.read_excel('工作簿1.xlsx')
print(excel.head(3))
print(excel.shape)

查看数据总行数、列数——shape方法

print(excel.shape) #(9,6)

转换数据类型——astype()函数

; 选择单行、多行标签——loc和iloc

loc通过行标签选择


data.loc[['d001','d002']]

iloc通过索引来选择


data.iloc[['d001','d002']]

data.iloc[1:2]

选择满足条件行

; 处理重复数据

planets = pd.read_csv('planets.csv')
print(planets.head(10))
planets.drop_duplicates(subset=['method','year'],keep='first',inplace=True)
print(planets.head(10))

planets.drop_duplicates(subset=[‘method’,’year’],keep=’first’,inplace=True)这个是最关键的语句了。
首先subset参数是一个列表，这个列表是需要你填进行相同数据判断的条件。就比如我选的条件是method和year，即 method值和year的值相同就可被判定为一样的数据。keep的取值有三个分别是 first、last、false
keep=first时，保留相同数据的第一条。keep=last时，保存相同数据的最后一条。keep=false时，所有相同的数据都不保留。inplace=True时，会对原数据进行修改。否则，只返回视图，不对原数据修改。

追加文件内容

def append_excel(df, content_list):
"""
   excel文件中追加内容
   :return:
   df:已有表格中数据
   content_list:待追加的内容列表
"""
    ds = pandas.DataFrame(content_list)
    df = df.append(ds, ignore_index=True)
    df.to_excel('c.xlsx', index=False, header=False)

append_excel(pandas.read_excel('c.xlsx', header=None), data)

Original: https://blog.csdn.net/weixin_55029563/article/details/120243397
Author: weixin_55029563
Title: python + pandas数据储存

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/753711/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

初始django

django-admin startporject 项目名django-admin stratapp 子应用名 TEMPLATES = [{‘BACKEND&#8217…

Python 2023年8月4日
0029
【深度学习】生成模型：VAE(自编码器)模型解析

目录 1 前言 2 VAE模型 * 2.1 VAE模型推导 2.2 重参化技巧 3 QA * 3.1 生成体现在什么地方 3.2 AE和VAE的区别 4 另一种角度理解VAE 5 …

Python 2023年10月9日
0041
python制作小游戏之二2048最终章

上一部分已经实现了2048游戏的核心规则内容，但是在我们移动了数字后，游戏界面并没有增加新的数字，所以我们需要在每次移动后，增加新的数字。同时如果按下按键，在按键方向上并没有可以移…

Python 2023年9月24日
0045
Tomcat安装步骤及详细配置教程（2022最新版）

网上的tomcat安装及配置教程一大堆，但是好多都过时了，根本不适用现在的版本，今天凯歌整理一篇Tomcat安装步骤及详细配置教程，2022年最新版~ Tomcat安装及配置教程主…

Python 2023年9月27日
0048
【Python基础篇012】匿名函数和全部内置函数详细认识（下篇）

🍁一、reversed内置函数 🍁二、slice内置函数 🍁三、format内置函数 🍁四、bytes内置函数 🍁五、bytearray内置函数 🍁六、memoryview内置函数…

Python 2023年8月2日
0048
【Python】发送微信公众号消息（附完整代码）一一CSDN21天学习挑战赛

目录一、微信公众号注册 * 注册测试号获取账号信息新增消息模板二、代码实现 * 新建access_token.py文件新建send_message.py文件新建main…

Python 2023年6月11日
0059
世界坐标系、相机坐标系和图像坐标系的转换

相机标定笔记坐标系转换四个不同类型的坐标系 * 1. 世界坐标系 2. 相机坐标系 3. 图像物理坐标系 4. 图像像素坐标系坐标转换 * 世界坐标 → 相机坐标（刚性变换）…

Python 2023年10月24日
0057
驱动开发：内核中的自旋锁结构

提到自旋锁那就必须要说链表，在上一篇 《驱动开发&#xFF1A…

Python 2023年6月11日
0065
Python代码阅读（第41篇）：矩阵转置

本篇阅读的代码实现了将一个使用嵌套列表表示的矩阵进行转置的功能。 def transpose(lst): return list(zip(*lst)) EXAMPLES trans…

Python 2023年6月15日
0059
什么是机器学习回归算法？【线性回归、正规方程、梯度下降、正则化、欠拟合和过拟合、岭回归】

1 、线性回归 1.1 线性回归应用场景房价预测销售额度预测金融：贷款额度预测、利用线性回归以及系数分析因子 1.2 什么是线性回归 1.2.1定义与公式线性回归(Line…

Python 2023年10月29日
0035
frida用法小汇总

Frida用法根据cpu版本去下载相应frida-server 运行./frida-sever & frida官网:https://frida.re/docs/javas…

Python 2023年5月24日
0063
windows安装cuda简易教程

为了利用GPU进行深度学习等，或者为了安装pytorch对应版本，我们需要安装cuda。一、cuda版本选择：我们首先需要了解自己电脑能够安装的cuda版本： 1.打开NVID…

Python 2023年8月3日
00130
Python直接使用plot()函数画图

目录一、plot（）函数的认识二、plot()函数基本运用三、plot()函数数据可视化画图以及图元基本参数设置一、plot()函数的认识在使用Python进行数据可视化…

Python 2023年7月31日
0068
Matplotlib绘制箱线图

箱线图（Box-plot）又称为盒式图或箱型图，是一种用来显示一组数据分散情况的统计图，它能显示一组数据的上界、下界、中位数、上下四分位数以及异常值等。箱线图的各部分组成及其含义如…

Python 2023年8月31日
0045
2.机器学习小记录–机器学习常用的python包

目录：一、numpy 二、pandas 三、matplot 四、seaborn 一、Numpy 1、numpy的介绍 numpy是python语言的一个第三方库，其支持大量高维度…

Python 2023年8月29日
0060
Python环境的安装（Anaconda+Jupyter notebook+Pycharm）

本文总结了Windows下Python环境的安装，包括Anaconda、Jupyter notebook和Pycharm的安装和基本使用技巧，方便初学者搭建Python环境。一、…

Python 2023年5月25日
0094

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30