pandas——常用操作

2023年7月8日下午11:24 • 人工智能 • 阅读 60

常用操作

import pandas as pd
import numpy as np

example = pd.DataFrame({'Amount': [74., 235., 175., 100., 115., 245., 180., 90., 88., 129., 273., 300.],
              'Category': ['Transportation', 'Grocery', 'Household', 'Entertainment',
                           'Transportation', 'Grocery', 'Household', 'Entertainment',
                           'Transportation', 'Grocery', 'Household', 'Entertainment'],
              'Month': ['January', 'January', 'January', 'January',
                        'February', 'February', 'February', 'February',
                        'Marth', 'Marth', 'Marth', 'Marth']})

example

AmountCategoryMonth074.0TransportationJanuary1235.0GroceryJanuary2175.0HouseholdJanuary3100.0EntertainmentJanuary4115.0TransportationFebruary5245.0GroceryFebruary6180.0HouseholdFebruary790.0EntertainmentFebruary888.0TransportationMarth9129.0GroceryMarth10273.0HouseholdMarth11300.0EntertainmentMarth

example.sort_values(by=['Month', 'Amount'], ascending=[True, False])

AmountCategoryMonth5245.0GroceryFebruary6180.0HouseholdFebruary4115.0TransportationFebruary790.0EntertainmentFebruary1235.0GroceryJanuary2175.0HouseholdJanuary3100.0EntertainmentJanuary074.0TransportationJanuary11300.0EntertainmentMarth10273.0HouseholdMarth9129.0GroceryMarth888.0TransportationMarth

data = pd.DataFrame({'k1':[1,2,3,5,5,4,6,2,2], 'k2':[12,8,11,4,4,52,30,18,18]})
data

k1k2011212823113544545452663072188218

data.sort_values(by='k2')

k1k2354454128231101127218821866305452

data.drop_duplicates()

k1k201121282311354545266307218

data.drop_duplicates(subset=['k1'])

k1k20112128231135454526630

data2 = pd.DataFrame({'k1':[1,5,3,16,19], 'k2':['A1','A2', 'A1', 'B2', 'A2']})
data2

k1k201A115A223A1316B2419A2

def map(series):
    if series['k2'] == 'A1':
        return 'A'
    elif series['k2'] == 'A2':
        return 'A'

data2['k2_map'] = data2.apply(map, axis=1)
data2

k1k2k2_map01A1A15A2A23A1A316B2None419A2A

df = pd.DataFrame({'t1':np.random.randn(5), 't2':np.random.randn(5)})
df

t1t200.909904-0.39409610.9431650.4802812-1.6162222.1531463-0.403424-1.16006040.8500741.280206

df2 = df.assign(ration = df['t1'] / df['t2'])

df2

t1t2ration00.909904-0.394096-2.30884010.9431650.4802811.9637792-1.6162222.153146-0.7506333-0.403424-1.1600600.34776240.8500741.2802060.664013

df2.drop('ration', axis=1)

t1t200.909904-0.39409610.9431650.4802812-1.6162222.1531463-0.403424-1.16006040.8500741.280206

age = pd.Series([18, 9, 6, 20, 26, 67, 52, 38, 40, 81, 36, 74, 88])
bins = [10, 40, 60, 90]
res = pd.cut(age, bins)
res

0     (10.0, 40.0]
1              NaN
2              NaN
3     (10.0, 40.0]
4     (10.0, 40.0]
5     (60.0, 90.0]
6     (40.0, 60.0]
7     (10.0, 40.0]
8     (10.0, 40.0]
9     (60.0, 90.0]
10    (10.0, 40.0]
11    (60.0, 90.0]
12    (60.0, 90.0]
dtype: category
Categories (3, interval[int64, right]): [(10, 40] < (40, 60] < (60, 90]]

pd.value_counts(res)

(10, 40]    6
(60, 90]    4
(40, 60]    1
dtype: int64

w = pd.cut(age, bins, labels=['youth', 'mid', 'old'])
pd.value_counts(w)

youth    6
old      4
mid      1
dtype: int64

res.isnull()

0     False
1      True
2      True
3     False
4     False
5     False
6     False
7     False
8     False
9     False
10    False
11    False
12    False
dtype: bool

qw = pd.Series([np.nan, 1, 2, 3])
qw

0    NaN
1    1.0
2    2.0
3    3.0
dtype: float64

qw.fillna(5)

0    5.0
1    1.0
2    2.0
3    3.0
dtype: float64

Original: https://blog.csdn.net/D_Low/article/details/123765446
Author: One_T.
Title: pandas——常用操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/679521/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析之股票分析

股票分析使用tushare包获取某股票的历史行情数据输出该股票所有收盘比开盘上涨3%以上的日期输出该股票所有开盘比前日收盘跌幅超过2%的日期假如从2010年1月1日开始，每…

人工智能 2023年7月8日
0054
如何用Python让你的电脑说话

如何用Python让你的电脑说话你成为亿万花花公子的第一步如果你是像《钢铁侠》这样的电影的粉丝，你可能已经幻想过得到你自己的贾维斯。那么，在这篇文章中，我将告诉你如何开始制作你…

人工智能 2023年6月28日
0057
主流深度学习算法简介

** 深度学习算法简介** 1、深度学习主流算法包括: 1.1 CNN (卷积神经网络)卷积神经网络（CNN）是最常见的深度学习方法之一。自20 世纪80 年代后期以来，CNN…

人工智能 2023年5月26日
0074
Livox Avia 雷达测试使用 —– 测试使用（Ubuntu18.04 + ROS Melodic）

Ubuntu18.04测试使用Livox Avia 雷达 * – 1. 新建ROS工程目录文件夹 – 2. 下载相关的源码和相关SDK依赖包 –…

人工智能 2023年6月1日
0087
【nacos】5.2 @RefreshScope + @Value 注解自动刷新配置

接上节：spring cloud + Nacos 实现统一配置管理问题：如何不启动spring boot项目自动更新@Value 注解的值？方案：类/方法/属性上使用@…

人工智能 2023年6月28日
0077
【学习笔记】深度神经网络基础

1. 监督学习和无监督学习监督学习简单定义：提供一组输入数据和其对应的标签数据，然后搭建一个模型，让模型在通过训练后准确地找到输入数据和标签数据之间的最优映射关系，在输入新的数据…

人工智能 2023年6月2日
0071
决策树算法之鸢尾花特征分类可视化详解【机器学习】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月3日
0079
【seaborn】sns.set() 绘图风格设置

目录 1. sns.set() 函数 2. 参数 style 指定的5种默认风格 * 1) sns.set(style=’white’) 2) sns.se…

人工智能 2023年7月25日
0054
粒子群算法求解0-1背包问题

目录一、粒子群算法的概念二、粒子群算法分析三、粒子群算法种类 1.基本粒子群算法 2.标准粒子群算法 3.压缩粒子群算法 4.离散粒子群算法四、粒子群算法流程五、例题一…

人工智能 2023年6月15日
0058
CVPR2021/邻域自适应/图像翻译-DRANet: Disentangling Representation and Adaptation Networks

CVPR2021/邻域自适应-DRANet: Disentangling Representation and Adaptation Networks for Unsupervis…

人工智能 2023年6月22日
0089
安装配置YOLOX —— 并改写训练数据集，设置常用功能

前言在安装YOLOX的过程中，可能会遇到一些问题，这些问题可能不是特别好找，现在就直接开整吧，记录一下配置YOLOX的全过程。主要写了一下一些内容：配置YOLOX，并自定义数…

人工智能 2023年7月9日
0077
数据分析（第三天）

探索性数据分析 import numpy as np import pandas as pd 了解你的数据吗？ arr = np.arange(8).reshape((2, 4))…

人工智能 2023年7月7日
0075
数据分析的重要性

— 总结自一个课程一．为什么数据分析重要在实际工作中无论是专业的数据分析岗位，还是运营、产品等岗位都开始关注从业者的数据分析能力，运营需要通过数据分析来解决流量、用户增长问题；产品…

人工智能 2023年7月16日
0046
假设检验中两类错误及最小样本量计算

脚注: 以下内容均为个人总结，便于日后查阅。如有不对地方，还请及时指正。案例：在互联网等行业中，大家会对产品、排序模型、机制策略等模块不断迭代/创新，来提升整个App的用户体…

人工智能 2023年7月16日
0057
python之dict3—— 用dict 将dataframe 聚类；根据一列，对另一列进行分类/聚类

用dict 将dataframe 聚类。根据一列，对另一列进行分类/聚类比如：对以下这个idc的dataframe，选取各大指数成分股先在dataframe中根据一列选取另一…

人工智能 2023年5月31日
0056
Springboot配置WebMvcConfig解决Cors非同源访问跨域问题

关于Cors跨域的问题，前端有代理和jsonp的常用方式解决这种非同源的访问拒绝策略，什么是同源？即域名一致端口一致但是端口下访问的接口api不同的两种或者几种的互相访问叫做同源访…

人工智能 2023年6月27日
0086

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pandas——常用操作

常用操作

大家都在看