python统计元素出现次数（accumarray实现）

2023年8月24日上午10:27 • Python • 阅读 58

本文介绍了利用python中的numpy模块构建二维的频次矩阵，对应于matlab中的 accummarrary()函数，matlab官方文档对于 accumarray()的介绍是：

B = accumarray(ind,data,sz) 根据 ind 中指定的组，通过对向量 data 的元素进行累加来对组数据求和。然后计算每组的总和,返回填充到 sz 大小的数组 B。ind 中的值定义数据所属的组以及存储每个组总和的输出数组 B 的索引。

也就是给出索引ind，以及对应索引上的data值，将同一索引对应data的值累加，以此作为B中ind对应位置的值B ( i , j ) = ∑ d a t a [ i n d ] B(i,j)=\sum data[ind]B (i ,j )=∑d a t a [in d ]。如果data设为全1，就可以认为ind为元素的出现表（一维二维皆可），返回矩阵统计了不同元素的出现次数B ( i , j ) = ∑ # ( i n d ) w h e n d a t a = e e T B(i,j)=\sum#(ind)\ when\ data=ee^T B (i ,j )=∑#(in d )w h e n d a t a =e e T，也就是频次矩阵。
目前python中比较常用的统计元素出现次数的方法为 np.bincout()，但它局限于一维正数组；如果使用list的 count()方法，又需要引入循环对每个不同元素计算出现次数，且要手动往频次矩阵填值；

如下给出两种方案来统计数组中元素出现数，并构建相应频次矩阵。

numpy方法

对于二维数组使用 unique()方法获得不同元素和它们出现次数，再直接向频次矩阵里填充值。代码如下：

data=np.random.randint(5,size=(2,6))
ind,times=np.unique(data,return_counts=True,axis=1)
freq=np.zeros((data.max()+1,data.max()+1))
freq[ind[0],ind[1]]=times

结果如下：

data
Out[21]:
array([[4, 0, 4, 3, 1, 4],
       [3, 4, 0, 3, 2, 3]])
freq
Out[22]:
array([[0., 0., 0., 0., 1.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0.],
       [1., 0., 0., 2., 0.]])

同理该方法可拓展至一维数组和非正整数组。

pandas方法

pandas方法利用 value_count()统计元素出现次数。

data=np.random.randint(5,size=(2,6))
freq=np.zeros((data.max()+1,data.max()+1))
data=pd.DataFrame(data.T)
times=data.value_counts()
ind=times.index.to_list()
ind=np.array(ind).T
times=times.to_numpy()
freq[ind]=times

结果如下：

data
Out[53]:
   0  1
0  2  1
1  4  4
2  4  1
3  2  3
4  4  4
5  1  0
freq
Out[54]:
array([[0., 0., 0., 0., 0.],
       [1., 0., 0., 0., 0.],
       [0., 1., 0., 1., 0.],
       [0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 2.]])

本文利用python实现了matlab中的 accumarray()，填补了网络上二维频次矩阵构建方法的空白。

Original: https://blog.csdn.net/Dr_maker/article/details/123921831
Author: 夜半罟霖
Title: python统计元素出现次数（accumarray实现）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/758419/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

drf — 视图类：GenericAPIView

视图类：GenericAPIView 作用：通用视图类主要作用就是把视图中的独特的代码抽取出来，让视图方法中的代码更加通用，方便把通用代码进行简写。新增的功能：继承自 APIV…

Python 2023年6月10日
0092
Pandas库

Pandas是python第三方库，提供高性能易用数据类型和分析工具。Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用。pandas库引用： impor…

Python 2023年8月1日
0066
Python-函数-字符串函数

#(1)add() 对两个数组的元素进行字符串连接 import numpy as np print(np.char.add(["xiaodu"],[&quot…

Python 2023年6月9日
0059
python爬虫Scrapy的安装

scrapy的安装过程中遇到error：socket.timeout: The read operation timed out 解决方式是 1、创建pip ini文件，添加清华国…

Python 2023年10月4日
0041
JavaWeb详解

一、基本概念 1.前言 web开发： web,网页的意思静态web html,css 提供给所有人看的数据始终不会发生变化动态web 提供给所有人看的数据始终会发生变化,每个人…

Python 2023年6月9日
0080
（3）Scrapy的Items（项目）

1.Items（项目）通常抓取的目标源一般都是非结构化来源，例如网页HTML等。我们需要从中提取结构化数据（解析数据）。Spider（蛛蛛）可以将提取的数据返回为Item（项目）…

Python 2023年10月2日
0044
Python伪代码分析点赞器实现原理

Original: https://www.cnblogs.com/123456feng/p/16179283.htmlAuthor: 蚂蚁ailingTitle: Python伪…

Python 2023年11月3日
0042
pycharm安装 numpy 库时出现 error occurred when installing package “numpy“以及解决办法

今天网上复制了一个代码，其中有个 import numpy as np，运行时提示需要安装 numpy 库，然后我按照网上的方法，按顺序点击 File –> Se…

Python 2023年8月23日
0093
No module named ‘utils‘，untils库的安装，不是pip和conda指令，特别可以的教程，还有为什么不能的原因，绝对良心。

这个问题相信难到了很多初学者，我们熟知像这样没有这个模块的错误直接使用下面这个： pip install utils 或者： conda install utils ，但是对于 u…

Python 2023年9月7日
00108
遗传算法解决函数优化问题

遗传算法解决函数优化问题作者: Cukor丘克环境: MatlabR2020a + vscode 为什么要学习遗传算法为什么要学习遗传算法，或者说遗传算法有什么厉害的地方。例…

Python 2023年10月29日
0062
pyqt入门

第一次接触pyqt是在20年刚毕业的时候，时隔两年，恰逢闲暇，正好回过头来对这个模块的知识进行一个整理，不会做系统化的整理，我打算可能会围绕之前做过的小工具对其涉及到的控件、信号和…

Python 2023年10月31日
0042
Scrapy爬虫之热门网站数据爬取———–第一关

第1关：猫眼电影排行TOP100信息爬取任务描述本关任务：爬取猫眼电影榜单TOP100榜的100部电影信息保存到本地MySQL数据库。 settings.py说到爬虫设置文件，…

Python 2023年10月2日
0047
flask-web APScheduler 定时任务以及实际应用

APScheduler （advanceded python scheduler）是一款Python开发的定时任务工具。特点：不依赖于Linux系统的crontab系统定时，独…

Python 2023年8月15日
0056
Django 基础（4）-Django 路由、一次更新多个记录（批量更新）

Django REST framework 增加了对 Django 自动 URL 路由的支持。 from rest_framework import routers router …

Python 2023年8月3日
0050
百度图片下载器2.0

前段时间写了一个百度图片下载器，结果发现有很多人需要使用。说实话之前写的那一款百度图片下载器比较LOW，今天刚好有时间就做了一下升级。获取完整源代码的方法在本文的末尾，如果需要，…

Python 2023年5月24日
0079
记一次靶场实战【网络安全】

前言【一一帮助安全学习一一】①网络安全学习路线②20份渗透测试电子书③安全攻防357页笔记④50份安全攻防面试指南⑤安全红队渗透工具包⑥网络安全必备书籍⑦100个漏洞实战案例⑧安…

Python 2023年11月6日
0039

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python统计元素出现次数（accumarray实现）

numpy方法

pandas方法

大家都在看