dataframe小技巧

2023年8月8日上午9:14 • Python • 阅读 38

一.基本操作篇

1.新建
自己定义column_name:

import pandas as pd
df = pd.DataFrame(columns=['col1','col2', 'col3', 'col4'])

延用之前的column_name:

df = pd.DataFrame(columns=list(article_df))csc

将一个list的值赋给某列：

df['B'] = listB

2.统计


list(mydf['mycolumnname']).count("xxx")

df['column_name'].unique()

newdf = df[(df.origin == "JFK") & (df.carrier == "B6")]

之二：

content='672844410'
x=df[df['column_name']==content]

之三：

df.query('code=="000002.SZ"')

多条件：


df.query('code=="000002.SZ" | code=="000006.SZ"')

多条件参考2，输入为list:

import pandas as pd
df = pd.DataFrame({'a':[1, 2, 3, 4, 5, 6],
     'b':[1, 2, 3, 4, 5, 6],
     'c':[1, 2, 3, 4, 5, 6]})
query_list = [1, 2]
df_2 = df.query('c not in @query_list')[['a', 'b']]

根据列名筛选：

df['column_name']

看两列：

article_df[['column_name1','column_name2']]

根据行数/列数筛选(iloc)：

df.iloc[:5,]
df.iloc[1:5,]
df.iloc[5,0]
df.iloc[1:5,0]
df.iloc[1:5,:5]
df.iloc[2:7,1:3]

看某几列：
1.按多少列

df.iloc[:,[0,1]]

2.按列名

df.loc[:,('列名','列名')]

根据hash_map筛选：

wrong_list = []
map = {'a': 1, 'b': 3, 'c': 7,'d':-1}
for index, row in article_df.iterrows():
    aging=row['key']
    if key is not None and key in map:
        value= map[key]
        if value!=-1:
            if row['key']!=value:
                   wrong_list.append(row['key'])

5.取列名

1.[column for column in df]
2.df.columns.values 返回 array
3.list(df)
4.df.columns 返回Index，可以通过 tolist(), 或者 list（array） 转换为list

6.df与常用类型转化
df ->list:

   list = df.values.tolist()

df=pd.DataFrame(list)

df->array:

 x=df.values

两个array合并：

np.hstack((mm.values,nn.values))

将array转化为DataFrame：

pd.DataFrame(np.hstack((mm.values,nn.values)))

7.设置列名

df.columns=['col1']

df1 = df1.append(df.iloc[0], ignore_index=True)

merge:列拼接

 data = pandas.merge(u_data, u_item, on="movie_id", how='left')
 data = pandas.merge(data, u_user, on="user_id", how='left')

9.df转csv

df.to_csv ("testfoo.csv" , encoding = "utf-8")

10.筛选 isin

`python
import pandas as pd

df = pd.read_excel(‘分类标准-新.xlsx’)

list0=[7664,7669,7674,7679,7684,7690,7695,7700,7706,7664,7711,7716,7721,7727,7732,7737,7743,7711,7748,7753,7758,7764,7769,7774,7780,7748,5047,5047]
a = df[(df[‘元素编码’].isin(list0))].index.tolist()

result=[]
for x in list0:

a = df[(df['元素编码']==x)].index.tolist()
print (a[0])
result.append(a[0])

df.ix[result][‘章节/元素名称’].tolist()
df.ix[result][‘元素名’].tolist()

Original: https://blog.csdn.net/yiweiwei516/article/details/121996069
Author: yiweiwei516
Title: dataframe小技巧

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/741960/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

mysql异步扩展_Scrapy 扩展中间件: 同步/异步提交批量 item 到 MySQL

0.参考 20180721新增：异步版本 1.主要实现 (1) 连接超时自动重连 MySQL server (2) 通过 item_list 收集 item，达到阈值后批量提交至数…

Python 2023年10月6日
0047
.net6&7中如何优雅且高性能的使用Json序列化

.net中的SourceGenerator让开发者编可以写分析器，在项目代码编译时，分析器分析项目既有的静态代码，允许添加源代码到GeneratorExecutionContext…

Python 2023年10月13日
0057
Python绘制饼状图对商品库存进行分析

今天来实践一下如何用Python对商品库存绘制饼状图进行分析一、知识点文件读写基础语法字符串处理文件生成数据构建二、效果展示一目了然 ; 三、代码展示兄弟们学习…

Python 2023年10月31日
0059
numpy函数—刘雯丽

（上课笔记篇） Numpy中常用的数据结构是ndarray格式使用array函数创建，语法格式为array(列表或元组)可以使用其他函数例如arange、linspace、zero…

Python 2023年8月29日
0037
pytest的介绍与使用

pytest介绍 pytest整合了unittest，包含了unittest中的方法，并且比其更轻便快捷，而且结合Allure报告能够清晰的生成测试报告。1、安装：pip inst…

Python 2023年9月13日
0049
pytest+allure生成测试报告

pytest+allure生成测试报告 1、安装allure-pytest 在pycharm中创建allure-test项目settings -> Project：allur…

Python 2023年9月10日
0055
Python 3 实现色情图片识别

Python 3 实现色情图片识别项目简介项目内容本实验将使用 Python3 去识别图片是否为色情图片，我们会使用到 PIL 这个图片处理库，会编写算法来划分图像的皮肤区域…

Python 2023年5月25日
0069
Pandas-数据结构-DataFrame（二）：设置索引【①创建DataFrame时添加行、列索引；②修改行/列索引值；③重设新下标索引；④以某列值设置为新的索引】

DataFrame索引修改的时候,需要进行全局修改对象.reset_index() 对象.set_index(keys) 创建学生成绩表 score = np.random.r…

Python 2023年8月7日
0050
【C++】从零开始的CS:GO逆向分析1——寻找偏移与基址的方法

【C++】从零开始的CS:GO逆向分析1——寻找偏移与基址的方法前言：此文章主要用于提供方法与思路，fps游戏基本都能如此找偏移，文章里找的偏移比较少，主要用来演示寻找思路，文章…

Python 2023年10月21日
0058
python字符串的一些骚操作和列表的一些操作

字符串：注意：字符串是不能修改的，它不像列表一样，可以修改其中某个元素，字符串常用操作:1、可以用 + 来实现对多个字符串的拼接产生一个新的字符串；可以将字符串与数字相乘重复打印…

Python 2023年10月31日
0037
扫地机器人地图与用户终端的同步

以下内容为本人的学习笔记，如需要转载，请声明原文链接微信公众号「englyf」 https://mp.weixin.qq.com/s/APaJheSbgTW3jNssWsp5Ng …

Python 2023年10月29日
0037
深度学习笔记：07神经网络之手写数字识别的经典实现

神经网络之手写数字识别的经典实现上一节完成了简单神经网络代码的实现，下面我们将进行最终的实现：输入一张手写图片后，网络输出该图片对应的数字。由于网络需要用0-9一共十个数字中挑选…

Python 2023年8月28日
0060
【数据分析】Numpy学习笔记(一)

最近在学习数据分析，到了numpy的学习阶段，边学边整理分享自己的学习笔记，希望能对你也有所帮助！这次的学习笔记包括以下内容：1.数组的创建方式2.多维数组的简单操作3.数组的索引…

Python 2023年8月25日
0085
Windows的Flask怎样让局域网的同事访问到

几个大步骤：代码实例： ; 1、关闭你的电脑防火墙； 2、你的同事和你，需要同一个局域网络； 3、你需要提供给他们你自己的内网IP，查看方式是cmd重输入ipconfig得到； …

Python 2023年8月10日
00178
Django打包试错

Django项目打包成exe 第一次打包Django项目，虽然知道最后会生成dist文件夹，但是在build文件夹里也找到了manage.exe，经过测试…直接删除了b…

Python 2023年8月4日
0034
pyTest

1、安装命令行pip install pytestpycharm安装下载pytest包，python setup.py install 2、start先创建一个简单的用例:def …

Python 2023年9月11日
0035

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

dataframe小技巧

一.基本操作篇

大家都在看