python人名统计_「姓名分析」Python|美国婴儿姓名分析 – seo实验室

姓名分析

python人名统计_「姓名分析」Python|美国婴儿姓名分析 - seo实验室

01 起

我们拿到一份1880-2016这136年间美国婴儿取名的数据(数据源在这里下载),数据总共有189万条,57.7M的大小,字段如下:

python人名统计_「姓名分析」Python|美国婴儿姓名分析 - seo实验室

下面我们使用Python3来对该数据集进行分析,看看一百多年来,男孩女孩姓名趋势。

首先读取1880-2016年的取名数据,由于每年的数据是一个独立的dataframe,因此我们使用concat()方法将各年数据整合为一个dataframeimport pandas as pd

读取1880-2016年婴儿姓名使用信息,由于信息表按年统计,因此需要将多年数据整合到一张表中

years=range(1880,2017)

columns=[“name”,”gender”,”frequency”]

pieces=[] #用于存储循环读取的每一年的数据,list中的每个元素代表一年的数据

使用循环读取每年数据,并将各年数据都存入pieces中,pieces列表的各元素表示各年的数据

for year in years:

Original: https://blog.csdn.net/weixin_36134015/article/details/113969380
Author: 知知与终生
Title: python人名统计_「姓名分析」Python|美国婴儿姓名分析 – seo实验室

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/676312/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球