pandas的内存使用

2023年7月7日上午10:53 • 人工智能 • 阅读 42

info

ataFram对象调用 info() 时会显示 DataFrame 的内存使用情况（包括索引）。
例如，调用 info() 时会显示下面的 DataFrame 的内存使用情况：

import pandas as pd
import numpy as np
dtypes = [
        "int8",
        "uint8",
        "int16",
        "int32",
        "int64",
        "float64",
        "datetime64[ns]",
        "timedelta64[ns]",
        "complex128",
        "object",
        "bool",
    ]
n = 5000

data = {"col_"+t: np.random.randint(100, size=n).astype(t) for t in dtypes}

df = pd.DataFrame(data)

df["categorical"] = df["col_object"].astype("category")

df.info()

output

RangeIndex: 5000 entries, 0 to 4999
Data columns (total 12 columns):
 #   Column               Non-Null Count  Dtype
 0   col_int8             5000 non-null   int8
 1   col_uint8            5000 non-null   uint8
 2   col_int16            5000 non-null   int16
 3   col_int32            5000 non-null   int32
 4   col_int64            5000 non-null   int64
 5   col_float64          5000 non-null   float64
 6   col_datetime64[ns]   5000 non-null   datetime64[ns]
 7   col_timedelta64[ns]  5000 non-null   timedelta64[ns]
 8   col_complex128       5000 non-null   complex128
 9   col_object           5000 non-null   object
 10  col_bool             5000 non-null   bool
 11  categorical          5000 non-null   category
dtypes: bool(1), category(1), complex128(1), datetime64[ns](1), float64(1), int16(1), int32(1), int64(1), int8(1), object(1), timedelta64[ns](1), uint8(1)
memory usage: 463.8 KB

memory_usage

每列的内存使用情况可以通过调用memory_usage()方法得到。这将返回一个 Series，其索引由列名和每列的内存使用情况表示，以字节为单位。对于上面的DataFrame，可以通过memory_usage方法查看每一列的内存使用量和总内存使用量：

如果要获取准确内存时候情况，可以开启参数deep=True

df.memory_usage(deep=True)
output
Index                     128
col_int8                 5000
col_uint8                5000
col_int16               10000
col_int32               20000
col_int64               40000
col_float64             40000
col_datetime64[ns]      40000
col_timedelta64[ns]     40000
col_complex128          80000
col_object             179800
col_bool                 5000
categorical              9968
dtype: int64

df.memory_usage(deep=True).sum()
#output
474896

Data typeDescription

Boolean (True or False) stored as a byte

Default integer type (same as C

; normally either

Identical to C

(normally

Integer used for indexing (same as C

; normally either

Byte (-128 to 127)

Integer (-32768 to 32767)

Integer (-2147483648 to 2147483647)

Integer (-9223372036854775808 to 9223372036854775807)

Unsigned integer (0 to 255)

Unsigned integer (0 to 65535)

Unsigned integer (0 to 4294967295)

Unsigned integer (0 to 18446744073709551615)

Shorthand for

Half precision float: sign bit, 5 bits exponent, 10 bits mantissa

Single precision float: sign bit, 8 bits exponent, 23 bits mantissa

Double precision float: sign bit, 11 bits exponent, 52 bits mantissa

Shorthand for

Complex number, represented by two 32-bit floats

Complex number, represented by two 64-bit floats

Original: https://blog.csdn.net/haohaizijhz/article/details/122722847
Author: 只要开始永远不晚
Title: pandas的内存使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676085/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

分位数回归与最小一乘法

刚开始学习分位数回归和最小一乘，在此记录一下我对分位数回归和最小一乘的理解文章目录一、分位数回归 * 1.分位数 2.分位数回归 3.求解方法二、最小一乘法参考一、分位数…

人工智能 2023年6月18日
0072
pandas行/列删除

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, e…

人工智能 2023年7月6日
0077
李沐-动手学深度学习-softmax介绍

回归估计一个连续值分类预测一个离散类别 softmax函数的解释： Softmax从字面上来说，可以分成soft和max两个部分。max故名思议就是最大值的意思。Softmax的…

人工智能 2023年6月17日
0080
机器学习-常用回归算法归纳(全网之最)

文章目录前言一元线性回归多元线性回归局部加权线性回归多项式回归 Lasso回归 & Ridge回归 * Lasso回归 Ridge回归岭回归和lasso回归的区…

人工智能 2023年7月26日
0068
TensorBoard详解之安装使用和代码介绍

目录 * – 1.TensorBoard详解 – + 1.1 环境 + 1.2 安装 + 1.3 展示 + 1.4说明 – 2.使用 &#821…

人工智能 2023年5月23日
0083
实时语音场景下的智能对话

目录：语音对话机器人：热线小蜜语音特色的文本驱动对话语音语义驱动的双工对话 1.语音对话机器人：热线小蜜 ; 实时语音对话的挑战：口语化：用户的表述呈现出含糊、冗长、不连续…

人工智能 2023年5月25日
0092
树莓派部署yolov 5目标检测的过程

工具：树莓派 * 1CSI摄像头 * 1 (提取码：4266 )下载，在传到树莓派中。再利用下面两条语句进行安装，可能在安装过程中会有一些报错大家耐心地把那些依赖安装好。 pip3…

人工智能 2023年7月12日
0071
Ubuntu 18.04 ROS Melodic中调用支持Python3的cv_bridge

这段时间搞了VINS-Mono和深度学习的结合，需要调用cv_bridge进行通信，而ROS Melodic默认安装的cv_bridge是支持python2.7的，而现在的深度学习…

人工智能 2023年5月28日
0076
线性回归实现

深度学习第一章：最简单的线性回归实现 1. 引言 AI领域的线性回归和其他领域不太一样，包括了名词和实现方式，所以必须先认识重要名词，再把所有步骤熟悉一边，并建立在之前学习线性回归…

人工智能 2023年6月4日
0099
VOC数据集解析–python实现分离图片训练分类网络

以voc2007数据为例，下载后的数据格式如下： Annotations文件夹里保存的是目标检测用到的 .xml文件，文件名是图像名称 ImageSets文件夹里面是图像划分的集合…

人工智能 2023年7月3日
0052
python中为什么用replace后数据还是没变_为什么dropna（）和replace（）方法不能处理dataframe中丢失的数据？…

我从一门数据科学课程开始，它要求我处理丢失的数据，要么删除”price”子集中包含NaN的行，要么用一些平均值替换NaN。但是dropna()和replac…

人工智能 2023年7月9日
0068
逻辑斯谛回归（Logistic回归）最详解

Logistic回归学习思路一.逻辑回归模型的原理与定义（主要思想）逻辑斯谛回归是经典的分类方法，它属于对数线性模型，原理是根据现有的数据对分类边界线建立回归公式，以此进行分类…

人工智能 2023年6月16日
0090
机器学习笔记 – 什么是高斯混合模型(GMM)？

1、高斯混合模型概述高斯混合模型 (GMM) 是一种机器学习算法。它们用于根据概率分布将数据分类为不同的类别。高斯混合模型可用于许多不同的领域，包括金融、营销等等！这里要对高斯混…

人工智能 2023年7月29日
0044
【游戏开发教程】BehaviorDesigner插件制作AI行为树（Unity | 保姆级教程 | 动态图演示 | Unity2021最新版）

文章目录 * – + 一、前言 + 二、插件下载 + * 1、AssetStore下载 * 2、GitCode下载 + 三、官方教程 + * 1、在线文档 * 2、离线…

人工智能 2023年7月25日
00168
【HSI】高光谱的数据集分类深度学习实战及代码理解

【HSI】高光谱的数据集分类深度学习实战及代码理解文章目录【HSI】高光谱的数据集分类深度学习实战及代码理解 * 一、配置文件编写二、高光谱图像的处理 – 2.1…

人工智能 2023年7月3日
0063
java中以字符分隔的字符串与字符串数组的相互转换

1.字符串数组拼接成一个以指定字符(包括空字符)分隔的字符串—— String.join()，JDK8的新特性 String[] strArray = {"aaa&quo…

人工智能 2023年6月6日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas的内存使用

info

memory_usage

大家都在看