pandas文件类型

pandas可以操作多种类型的文件, 为什么要有那么多种文件类型, 不可以统一成一种吗?

答案当然是不可以的, 例如我们熟知的CSV, HDF5, JSON都有他们独特的优点, 这些优点又不能兼得, 我们在生产环境中一般考虑如下几个特点

1. 数据文件格式是否能够跨平台
2. 数据文件是否支持压缩
3. 数据文件是否可读
4. 数据文件是否能写入多种数据

CSV: 跨平台, 支持文件压缩, 可读性高, python写入多类型数据不好区分

例如:

import numpy as np
import pandas as pd

row_index = ["a" + str(i) for i in range(10)]
col_index = ["b" + str(i) for i in range(10)]
data1 = pd.DataFrame(np.random.randint(0, 10, (10, 10)), index=row_index, columns=col_index)
data2 = pd.DataFrame(np.random.randint(0, 10, (10, 10)), index=row_index, columns=col_index)
data1.to_csv("./demo02.csv", mode='w')
data2.to_csv("./demo02.csv", mode='a')
print(pd.read_csv("./demo02.csv"))

pandas文件类型

可见CSV中存放多类型数据是不方便的, 结果读出来后, 得自己去做处理

HDF5:跨平台, 支持压缩(压缩效果较CSV强), 支持多种类型数据写入, 没有可读性

数据处理时, 推荐使用HDF5

现在使用 DataFrame.to_hdf()方法时, 路径中含有中文的时候, 会报错, 这个Bug尚未修复, 要养成编码过程中不要使用中文的习惯, 减少不必要的Bug

import numpy as np
import pandas as pd

data1.to_hdf("./demo03.h5", key="data1", mode="w")
data2.to_hdf("./demo03.h5", key="data2", mode="a")
pd.read_hdf("./demo03.h5", key="data1")

JSON: 跨平台, 不支持压缩, 不支持多种数据类型, 具有可读性

pandas 操作 json 数据时, orient 参数不同, 所得结果不同
data1.to_json("./demo04.json", orient="split", )
data1.to_json("./demo05.json", orient="records")
data1.to_json("./demo06.json", orient="index")
data1.to_json("./demo07.json", orient="columns")
data1.to_json("./demo08.json", orient="values")

以上是常用的三种数据文件类型, 推荐使用HDF5做数据共享, 传输

Original: https://blog.csdn.net/qq_29304033/article/details/115871660
Author: 贰の⑩次方
Title: pandas文件类型

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/755678/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 一台虚拟机,基于docker搭建大数据HDP集群

    前言 好多人问我,这种 基于大数据平台的xxxx的毕业设计要怎么做。这个可以参考之前写得关于我大数据毕业设计的文章。这篇文章是将对之前的毕设进行优化。 个人觉得可以分为两个部分。第…

    Python 2023年10月16日
    029
  • 【Pygame小游戏】 史上最经典的外星人游戏 ,全面保障 勇敢去闯 (未解之谜)

    前言 说说外星人那些事儿…. 你以为的外星人……他们都是乘坐UFO来地球的,长的嗯哼可能比较有特色。也许长这样👇 害!其实可能也或许不长这样。 …

    Python 2023年9月19日
    044
  • flask数据请求,获取数据和响应数据

    1.请求相关的数据 参数或信息解释固定参数URL的组成部分, 不可缺失查询字符串: args根据需求, 可有可无表单数据: form提交form表单是传递的数据文件上传: file…

    Python 2023年8月11日
    045
  • 基于OpenCv的人脸识别,翻车了居然识别错误。

    前言 我们身边的人脸识别有车站检票,监控人脸,无人超市,支付宝人脸支付,上班打卡,人脸解锁手机。人脸检测是人脸识别系统组成的关键部分之一,其目的是检测出任意给定图片中的包含的一个或…

    Python 2023年11月5日
    030
  • React + Springboot + Quartz,从0实现Excel报表自动化

    一、项目背景 企业日常工作中需要制作大量的报表,比如商品的销量、销售额、库存详情、员工打卡信息、保险报销、办公用品采购、差旅报销、项目进度等等,都需要制作统计图表以更直观地查阅。但…

    Python 2023年10月18日
    041
  • python pandas.pivot_table透视表函数

    文章目录 一、官方文档 二、参数解析 三、案例解析 * 3.1 新建数据集 3.2 两种写法 3.3 columns参数 3.4 fill_value 缺失值填充 3.5 marg…

    Python 2023年8月8日
    082
  • 关于scrapy的代理问题

    今天帮同学解决scrapy的时候发现的,就是在我这里能运行,在他那里不能运行。对比scrapy的版本发现,他的是最新的(2.6.3),然后我的是2.5.0的。随后我将他的版本也换成…

    Python 2023年10月31日
    038
  • python缺失值填充方法

    缺失值填充 1.找到缺失值 2.计算缺失值的数量 3.处理缺失值 * 3.1:df.dropna():直接删除行列 3.2:df.fillna()填充缺失值 3.3:KNN填充 4…

    Python 2023年8月1日
    061
  • 前端交互、前后端交互、数据格式转换基础相关知识

    目录 前端交互简单基础 前后端交互、数据格式转换 快速上手第一个flask应用小应用 例2flask应用:将当前目录下的文件(文件或者文件夹)以文本形式显示出来 数据格式转换 前端…

    Python 2023年8月11日
    046
  • Python制作自动答题脚本,100%准确率,1秒10题提高效率

    前言 环境使用 Python 3.8 Pycharm 模块使用 import requests —> 数据请求模块 pip install requests import p…

    Python 2023年6月9日
    061
  • Py之tkinter:tkinter库的简介、安装、使用方法之详细攻略

    Py之tkinter:tkinter库的简介、安装、使用方法之详细攻略 tkinter库的简介 tkinter库的安装 tkinter库的使用方法 1、tkinter的控件简介 1…

    Python 2023年8月1日
    038
  • Ai studio 使用教程:

    Ai studio地址:飞桨AI Studio – 人工智能学习实训社区 (baidu.com) 使用 Ai studio 的算力需要相应的算力卡,进行登陆注册后可领取…

    Python 2023年9月28日
    086
  • TinyShell(CSAPP实验)

    学生实现他们自己的带有作业控制的Unix Shell程序,包括Ctrl + C和Ctrl + Z按键,fg,bg,和 jobs命令。这是学生第一次接触并发,并且让他们对Unix的进…

    Python 2023年10月13日
    032
  • Python Pandas库教程

    文章目录 前言 1 Pandas数据结构 * 1.1 Series – 1.1.1 Series数据操作 1.1.2 Series数据分析 1.2 DataFrame …

    Python 2023年8月16日
    055
  • 浅谈深度学习中的概率

    摘要:本次就和大家聊一聊深度学习中的概率。 为什么会用到概率呢?因为在深度学习中经常会需要处理随机的数据,或者包含随机性的任务,随机性也来自非常多的方面,所以在存在不确定性的情况下…

    Python 2023年10月24日
    027
  • matplotlib绘图

    1.绘制单图、多图、图中图 1.1基本概念 fig 画布 axes 画布上绘制的坐标轴(包含x轴和y轴或z轴),一个fig上可以绘制多个axes axis:x轴、y轴、z轴 fig…

    Python 2023年9月2日
    046
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球