pandas—pandas.read_parquet

文章目录

*

+ 引言
+ 1.pd.read_parquet

引言

小伙伴可能要问了,这是个什么玩意?pd.read_csv不行嘛?结果都是返回DataFrame。确实结果是一样的,可是加载数据的耗时相差很多。从以下对比的小例子中就可以简单的看出:

pandas—pandas.read_parquet
pandas—pandas.read_parquet

; 1.pd.read_parquet

pandas.read_parquet(path, engine='auto', columns=None, use_nullable_dtypes=False, **kwargs)

描述

从文件路径加载一个parquet对象,返回一个DataFrame

参数

path : str, path object or file-like object
文件路径

engine : {‘auto’, ‘pyarrow’, ‘fastparquet’}, default ‘auto’
如果为”自动”,则使用选项io.parquet.engine。
io.parquet.engine的默认行为是尝试使用” pyarrow”,如果” pyarrow”不可用,则退回到” fastparquet”。

columns : list, default=None
如果不是None,则只从文件中读取这些列

use_nullable_ : dtypesbool, default False

返回

DataFrame

如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论留言!

pandas—pandas.read_parquet

Original: https://blog.csdn.net/weixin_46649052/article/details/112853295
Author: 哎呦-_-不错
Title: pandas—pandas.read_parquet

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/752085/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球