python实现数值型变量分段统计

2023年7月7日下午12:56 • 人工智能 • 阅读 65

实现功能：

对年龄（age）这一数值型变量进行分段统计，统计每一区间（年龄段）患者人数。

实现代码：

import numpy as np
import pandas as pd

def Read_data(file):
    dt = pd.read_csv(file)
    dt.columns = ['age', 'sex', 'chest_pain_type', 'resting_blood_pressure', 'cholesterol',
                  'fasting_blood_sugar', 'rest_ecg', 'max_heart_rate_achieved','exercise_induced_angina',
                  'st_depression', 'st_slope', 'num_major_vessels', 'thalassemia', 'target']
    data =dt
    pd.set_option('display.max_rows', None)
    pd.set_option('display.max_columns', None)
    pd.set_option('display.width', None)
    pd.set_option('display.unicode.ambiguous_as_wide', True)
    pd.set_option('display.unicode.east_asian_width', True)
    print(data.head().append(dt.tail()))
    return data

def Segment_statistics(data):
    age = data[["age"]]
    bins = [20, 30, 40, 50, 60, 70, 80, 90, 100, 110]
    age2 = pd.cut(age.values.flatten(), bins=bins)
    print(age2)
    print(age2.value_counts())
    age2 = pd.DataFrame(age2, columns=["年龄段"])  #
    age3 = pd.concat([age, age2], axis=1)
    print(age3)
    return

if __name__=="__main__":
    data1=Read_data("F:\数据杂坛\\0504\heartdisease\Heart-Disease-Data-Set-main\\UCI Heart Disease Dataset.csv")
    Segment_statistics(data1)

实现效果：

将年龄这一数值型变量进行分段，间隔为10年，统计出每个区间的患者人数，例如20-30的有1人，30-40的有16人…,同时实现增加年龄段这一列。

喜欢记得点赞，在看，收藏，

关注V订阅号：数据杂坛，获取完整代码和效果，将持续更新！

Original: https://blog.csdn.net/sinat_41858359/article/details/124857883
Author: 不再依然07
Title: python实现数值型变量分段统计

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/676293/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【我是土堆 – PyTorch教程】学习随手记

目录 1. Pytorch环境的配置及安装如何管理项目环境？如何看自己电脑cuda版本？安装Pytorch 2. Python编辑器的选择、安装及配置 PyCharm PyC…

人工智能 2023年6月23日
0074
使用PyTorch搭建VGG模型进行图像风格迁移实战（附源码和数据集）

需要源码和图片集请点赞关注收藏后评论区留言或者私信~~~ 一、VGG模型 VGG模型是科学家们提出的图像分类模型，这一模型采用了简单粗暴的堆砌3×3卷积层的方式构建模型，并花费大量…

人工智能 2023年6月28日
0079
Vue+Element之SpingBoot学生管理系统

目录前后端分离 1.1后端 1.1.1配置generatorConfig.xml中的mysql文件目录,自动生成代码 1.1.2mapper层 1.1.2.1mapper.xml…

人工智能 2023年6月30日
0093
Svm算法原理简单梳理

这里首先简单介绍一下svm算法：（1）支持向量机（Support Vector Machine, SVM）是一种对数据进行二分类的广义线性分类器，其分类边界是对学习样本求解的最大…

人工智能 2023年6月16日
00108
【Python函数式编程⑤】——返回函数、闭包、装饰器、偏函数

🤵‍♂️ 个人主页: @Flyme awei 个主页👨‍💻 作者简介： Python领域新星创作者。📒 系列专栏：《在线编程-Python篇》🌐 推荐一款 找…

人工智能 2023年7月6日
0074
yolov5的TensorRT部署–动态batch

本文对于上面的案例，从多batc的角度详细讲解对于充分利用多batch，能大大提升模型的检测速度，例如多个视频流进行目标检测，我们可以获取多个视频流中的图片，都多张图片一起送往一…

人工智能 2023年6月25日
0069
康耐视Visionpro-3D Tools 总览

(Q有答疑)0.康耐视visionpro相机连接 3D Tools 总览 Cog3DPlanePlaneAngleScript Cog3DRangeGreySplitterScri…

人工智能 2023年7月28日
00198
使用neo4j import工具导入csv数据

参考文档官方链接（英文）https://neo4j.com/labs/apoc/4.3/import/import-csv/ 参考dalao文档链接https://blog.cs…

人工智能 2023年6月1日
0086
Pandas loc与iloc

先来看一下示例： #!/usr/bin/python import pandas as pd 三个字&#x…

人工智能 2023年7月7日
0067
【深度学习】踩坑日记：模型训练速度过慢，GPU利用率低

问题描述显然GPU利用率为0就很不正常，但是有显存占用说明模型应该是在跑的。后来既然GPU利用不起来，我干脆同时跑多个模型，想充分利用，但是效果还不是很明显，速度依然都很慢。查了…

人工智能 2023年7月22日
0077
Collaborativ

介绍 Collaborative Filtering（协同过滤）是一种常用的推荐系统算法，其基本思想是利用用户对物品的偏好信息来预测用户对未知物品的喜好程度。在本文中，我们将详细介…

人工智能 2024年1月2日
0041
Oracle Database 19c 新特性之 ANY_VALUE 聚合函数

ANY_VALUE 函数是 Oracle 19c 新增的一个聚合函数，可以为分组操作之后的每个组返回一个任意值，可以解决查询字段不属于 GROUP BY 字段的问题。 SELECT…

人工智能 2023年7月29日
0059
Python实时垃圾分类系统（环境教程＆完整源码＆数据集)

1.背景如今，垃圾分类已成为社会热点话题。其实在2019年4月26日，我国住房和城乡建设部等部门就发布了《关于在全国地级及以上城市全面开展生活垃圾分类工作的通知》，决定自2019…

人工智能 2023年6月30日
0076
神经网络中如何确定隐藏层的层数和大小

在前馈神经网络中，隐藏层的数量和层数的确定尚无依据，一般是由经验决定。查阅了大量相关的文章之后我对其进行了综合梳理。这里需要明确的一点是，这些只是根据经验提出的一些参考的方法，…

人工智能 2023年6月15日
0085
智能窗帘控制(语音、时间、光、红外)

设计简介：本设计是一款智能窗帘控制(光、红外、时间、语音)，主要实现以下功能： [En] This design is an intelligent curtain contro…

人工智能 2023年5月25日
0067
如何学习数据分析？数据分析平台来帮你

数据开启未来，在不久的将来，数据将成为第一生产力。无论是职场小白，还是高层管理者，每个人都将无法逃脱这场数据变革带来的冲击。面对环境的剧烈变化，每个人都应该好好思考一个问题：我要如…

人工智能 2023年7月17日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python实现数值型变量分段统计

大家都在看