Python（数据分析篇）— Pandas框架【一】DataFrame数据创建以及元素的增删改查

2023年8月7日下午10:06 • Python • 阅读 58

pandas主要分为如下几个阶段：

首先，导入相应模块

import pandas as pd
import numpy as np

dataframe是一种表格型数据结构，拥有axis=0，axis=1（），所以dataframe类型肯定是二维的

方法一：

df = pd.DataFrame(data=[['ss',20,'男','0831'],['zs',22,'男','0831'],['lh',21,'女','0831']], index=['a','b','c'], columns=['name','age','gender','class'])

说明：

方法二：

pd.DataFrame(data={
    'name':['ss','zs','lh'],
    'age':[20,22,21],
    'gender':['男','男','女'],
    'class':['0831','0831','0831']
})

生成的表格：

ageclassgendername0200831男ss1220831男zs2210831女lh

1.结构

print('结构：',df.shape)

&#x7ED3;&#x6784;&#xFF1A; (3, 4)

2.维度

print(df.ndim)

3.元素个数

print(df.size)

4.元素类型

print(df.dtypes)

name      object
age        int64
gender    object
class     object
dtype: object

5.查看列索引

print(df.columns)

Index(['name', 'age', 'gender', 'class'], dtype='object')

6.查看行索引

print(df.index)

Index(['a', 'b', 'c'], dtype='object')

7.查看数据

print(df.values)
print(type(df.values))

[['ss' 20 '&#x7537;' '0831']
 ['zs' 22 '&#x7537;' '0831']
 ['lh' 21 '&#x5973;' '0831']]
<class 'numpy.ndarray'>
</class>

1、dataframe查找

df['name']

df[['name']]

输出结果：仅有一列值的表格

nameassbzsclh

语法：df.loc [ 行索引名称/条件，列的索引名称 ]


df.loc['a',:]
df.loc[['a','b'],'name']

输出：

a    ss
b    zs
Name: name, dtype: object

行（列）两个都传入列表类型，返回二维dataframe类型

print(df.loc[['a','b'],['name','age']])

输出：

  name  age
a   ss   20
b   zs   22

使用mask，生成bool值表格，根据布尔值取值


mask = df['age']>18
print(mask)
df.loc[mask,'name']
df.loc[mask,['name','class']]

布尔值mask表格：

a    True
b    True
c    True
Name: age, dtype: bool

根据mask取出的表格：

nameclassass0831bzs0831clh0831

例2：
mask可以联合使用，使用逻辑符进行连接


mask1 = df['age']>18
mask2 = df['gender'] == '女'
mask = mask1 & mask2
df.loc[mask,:]

nameagegenderclassclh21女0831

df.iloc[行的位置索引，列的位置索引]


df.iloc[-1,:].index

Index(['name', 'age', 'gender', 'class'], dtype='object')

2、dataframe增加方法


df['address'] = ['北京','上海','北京']
print(df)

输出：

  name  age gender class address
a   ss   20      &#x7537;  0831      &#x5317;&#x4EAC;
b   zs   22      &#x7537;  0831      &#x4E0A;&#x6D77;
c   lh   21      &#x5973;  0831      &#x5317;&#x4EAC;

当给一个值时，可将所有元素的address改为同一个值

df['address'] = '北京'
print(df)

输出：

  name  age gender class address
a   ss   20      &#x7537;  0831      &#x5317;&#x4EAC;
b   zs   22      &#x7537;  0831      &#x5317;&#x4EAC;
c   lh   21      &#x5973;  0831      &#x5317;&#x4EAC;

使用append方法

df_mini = pd.DataFrame(data={
    'name':['ss','zs','lh'],
    'age':[20,22,21],
    'gender':['男','男','女'],
    'class':['0831','0831','0831']})

df2 = df.append(df_mini,ignore_index=True)

说明：

3、dataframe删除方法

语法：df.drop(labels, axis=0, level=None, inplace=False, errors=’raise’)
说明：


df2.drop(labels=['address','class'],axis=1)

返回删除之后的表格

agegendername020男ss122男zs221女lh320男ss422男zs521女lh


df2.drop(labels = [0,1,2],axis=0)

删除行还是列，根据axis决定

addressageclassgendername3NaN200831男ss4NaN220831男zs5NaN210831女lh

4、dataframe更该数值方法


df.loc[df['name']=='lh','class'] = '有问题'
print(df)

输出：

  name  age gender class address
a   ss   20      &#x7537;  0831      &#x5317;&#x4EAC;
b   zs   22      &#x7537;  0831      &#x5317;&#x4EAC;
c   lh   21      &#x5973;   &#x6709;&#x95EE;&#x9898;      &#x5317;&#x4EAC;

Original: https://blog.csdn.net/Zachary579/article/details/112251017
Author: Zachary579
Title: Python（数据分析篇）— Pandas框架【一】DataFrame数据创建以及元素的增删改查

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/740997/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

1896-2021历届奥运会奖牌榜动态排序（Matplotlib图表动画）

摘要在制作动态排序动画之前，我们看一下数据的整理情况： a、对第1）种大部分数据的情况，先爬取下来，输出到excel（1）； b、对第2）种小部分数据的情况，也先爬取下来，输出…

Python 2023年8月16日
0057
UnixLinux多线程复健

线程是程序中完成一个独立任务的完整执行序列(是一个可调度的实体) 一个进程可以包含多个线程查看指定进程的线程号： ps -Lf pid 进程是CPU分配资源的最小单位，线程是操作…

Python 2023年11月4日
0083
python学习笔记——flask之request

from flask import request 就是 Flask 中表示当前请求的 request 对象，request对象中保存了一次HTTP请求的一切信息。一、代码（打印…

Python 2023年8月13日
0044
Package | 解决 RuntimeError: Numpy is not available. Failed to initialize NumPy against version 0xf

在docker里配置实验环境，根据repo中的指令”pip install -r requirement.txt”，安装完必要的包，具体信息如下。&#822…

Python 2023年8月25日
0055
pandas 基于日期的统计

概要在分析时间序列数据时，几乎需要按照数据的维度进行统计。 [En] When analyzing time series data, it is almost necessar…

Python 2023年5月24日
0095
python之panda模块1

Python是一门实现数据可视化很好的语言，他们里面的很多库可以很好的画出图形，形象明了。今天我们就来说说:Pandas数据分析核心支持库初识Pandas： Pandas 是 …

Python 2023年8月20日
0036
pygame 移开的矩形留痕迹_Pygame，移动一个矩形并删除位于先前位置的旧矩形

我写这段代码是因为我想用箭头键移动一个矩形。它可以工作，但是循环循环不会移动矩形，而是每次都创建一个新的矩形。结果就像一条轨迹。你可以在图片中看到：the result of t…

Python 2023年9月23日
0046
Django笔记

程序安装： pip3 install django 配置系统环境: 成功安装Django后，在python目录script路径可找到django-admin.exe文件，将它加入操…

Python 2023年8月4日
0060
DataWhale 数据可视化matplotlib 学习记录

DataWhale matplotlib 学习记录一、Matplotlib 初相识 1. 认识matplotlib Matplotlib是一个Python 2D绘图库，能够以多种…

Python 2023年9月3日
0060
scrapy框架（3）：CSS选择器解析数据

CSS选择器提取数据一、HTML涉及内容补充：二、css选择器介绍三、实操 * 1、前提 2、code实现的方法介绍 – ①、Pycharm debug ②、黑窗…

Python 2023年10月2日
0053
liunx命令python执行出错，bash: ./xxxxx.py: /usr/bin/python: 坏的解释器：没有那个文件或目录

第一种情况（装了Python3但是不需要输入python就指向python3，也就是没有改变python的指向）：进入/usr/bin目录，查看目录下的python链接（我这儿p…

Python 2023年5月25日
00146
CTFshow–常用姿势

文章目录 * – web801 – web802 – web803 – web804 – web805 – …

Python 2023年8月9日
0056
aconda+python安装

文章目录一、conda的安装二、安装Pytorch（无GPU，cpu） * 2.1conda虚拟环境： – 2.1.1cmd 创建虚拟环境 2.1.2查看已有的虚拟…

Python 2023年9月8日
0080
Flink同步Kafka数据到ClickHouse分布式表

公众号文章都在个人博客网站：https://www.ikeguang.com/ 同步，欢迎访问。业务需要一种OLAP引擎，可以做到实时写入存储和查询计算功能，提供高效、稳健的实时…

Python 2023年10月13日
0047
Istio设置请求超时和重试

当请求后端服务响应过慢的时候，为了不产生积压请求，不拖垮其他服务，主动注入故障，返回超时信息主动注入故障可以减少等待时消耗的资源，避免请求积压，避免级联错误问题。超时也可以设置在…

Python 2023年8月11日
0052
用户的交互

用户的交互用户交互：人往计算机中 input/输入数据，计算机print/输出结果 input 输入输入input：程序执行input，程序就会停止下来等待用户键盘输入，用户输…

Python 2023年5月23日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31