Boss直聘招聘数据分析岗位小分析

嗨喽! 大家好,我是”流水不争先,争得滔滔不绝”的翀,18双非本科生一枚,正在努力!欢迎大家来交流学习,一起学习数据分析,希望我们一起好好学习,天天向上,目前是小社畜一枚~~

前言

完整数据包括一些简单的分析,做得很简单,因为累了要睡了
详细文档与数据下载超链接

Boss直聘招聘数据分析岗位小分析
import pandas as pd
import matplotlib.pyplot as plt
import jieba
from collections import Counter
import pandas as pd
from wordcloud import WordCloud

import warnings
warnings.filterwarnings("ignore")
data =pd.read_excel('./boss网站招聘岗位信息.xlsx',sheet_name='Sheet1')

1 数据探索

data.info()
<class 'pandas.core.frame.dataframe'>
RangeIndex: 2913 entries, 0 to 2912
Data columns (total 9 columns):
 #   Column  Non-Null Count  Dtype

标题数据分析师162大数据开发156大数据开发工程师118Python117爬虫工程师106……Java开发工程师1系统运维1人工智能讲师(四川科技)1【2022校招】数据分析1AI 算子测试开发1

913 rows × 1 columns

None

公司名中软国际151法本67博彦科技53软通动力信息技术集团37神州信息18……吉灵科技1河南日盛1深度智耀1北京千喜鹤公司1无锡出类1

1936 rows × 1 columns

None

薪资10-15K1478-13K725-10K714-6K5715-30K53……22-44K17-11K·13薪1400-600元/天115-18K·13薪170-80K1

483 rows × 1 columns

None

规模10000人以上74320-99人621100-499人5731000-9999人4910-20人315500-999人170

None

详情页https://www.zhipin.com/job_detail/4c25812b39e3b0321nx53925EFdW.html13https://www.zhipin.com/job_detail/b53e88d4252d99b11nxy2Nm4FVJW.html13https://www.zhipin.com/job_detail/67288b9757b2ef7303150928GFI~.html13https://www.zhipin.com/job_detail/bfc8af865c7e41001nB82dy5EVBT.html13https://www.zhipin.com/job_detail/6dd6a0d1e6234f2b1nx-2NS9FFBR.html13……https://www.zhipin.com/job_detail/344ea19ce102f33e1nF93N-_F1JR.html1https://www.zhipin.com/job_detail/2778e16c9b3f31d01nJ53NS_GVRR.html1https://www.zhipin.com/job_detail/80ccca15466fca951nF-3Ny_FVpS.html1https://www.zhipin.com/job_detail/c484ae92e5af62ad1n142Ny_ElFQ.html1https://www.zhipin.com/job_detail/0b2e0a2d249a171d1nJ-2dq4FlpS.html1

2595 rows × 1 columns

None

2 数据分析

guimo = pd.DataFrame(data['规模'].value_counts().reset_index())
guimo = guimo.rename(columns={'index':'规模','规模':'人数'})
plt.rcParams["font.family"] = 'Arial Unicode MS'
plt.bar(guimo['规模'], guimo['人数'])
plt.xlabel('规模')
plt.ylabel('人数')
x=np.arange(6)

y=np.array(list(guimo['人数']))
for a,b in zip(x,y):
    plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=10)
plt.title('公司规模人数的直方图分布')
Text(0.5, 1.0, '&#x516C;&#x53F8;&#x89C4;&#x6A21;&#x4EBA;&#x6570;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x5206;&#x5E03;')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aoOz66NN-1641306756600)(output_7_1.png)]

  • 2分析数据分析的学历要求
data['学历'] = '天天开心'
xueli = ['大专以下','大专','本科','硕士','博士','学历不限']
c = Counter()
for i in range(len(data)):
    for j in xueli:
        if j in data['经验'][i]:
            c[j]+=1
xueli_data = pd.DataFrame([])
for (k,v) in c.most_common(5):
    xueli_data = xueli_data.append(pd.DataFrame({"学历":[k], "数量":[v]}), ignore_index=True)
plt.rcParams["font.family"] = 'Arial Unicode MS'
plt.bar(xueli_data['学历'], xueli_data['数量'])
plt.xlabel('学历')
plt.ylabel('数量')
x=np.arange(5)

y=np.array(list(xueli_data['数量']))
for a,b in zip(x,y):
    plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=10)
plt.title('数据分析学历要求的直方图分布')
Text(0.5, 1.0, '&#x6570;&#x636E;&#x5206;&#x6790;&#x5B66;&#x5386;&#x8981;&#x6C42;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x5206;&#x5E03;')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oZ8R2oxG-1641306756602)(output_9_1.png)]

data['city'] = '天天开心'
for i in range(len(data)):
    data['city'][i] = data['地区'][i].split('·')[0]
city = pd.DataFrame(data['city'].value_counts().reset_index())
city = city.rename(columns={'index':'city','city':'数量'})[:10]
plt.rcParams["font.family"] = 'Arial Unicode MS'
plt.bar(city['city'], city['数量'])
plt.xlabel('city')
plt.ylabel('数量')
x=np.arange(10)

y=np.array(list(city['数量']))
for a,b in zip(x,y):
    plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=12)
plt.title('数据分析公司城市的直方图分布')
Text(0.5, 1.0, '&#x6570;&#x636E;&#x5206;&#x6790;&#x516C;&#x53F8;&#x57CE;&#x5E02;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x5206;&#x5E03;')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-f0IdsWN7-1641306756604)(output_10_1.png)]

  • 4 词云图
def cal_word_freq(texts):
    words = []
    for text in texts:
        words.extend(list(jieba.cut(text)))
    return pd.Series(words).value_counts()
data['福利']=data['福利'].astype(str)
qieci = pd.DataFrame(cal_word_freq(data['福利'].to_list()).reset_index())
qieci = qieci.rename(columns={'index':'key_word','0':'词频'})[:50]
bimg = imread('heart.jpeg')
wordcloud = WordCloud(background_color="white", mask=bimg, font_path='simhei.ttf')
wordcloud = wordcloud.fit_words(words_stat.head(4000).itertuples(index=False))
bimgColors = ImageColorGenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgColors))
plt.show()
qieci.to_excel('./词云.xlsx',index=False)
qieci

key_word00,192131五险23942一金23743带薪21594年21555假21546福利21347节日20918年终奖19959补助197110体检178811定期178212员工154613旅游153314零食128615下午茶128316餐补125917加班110618补充94719医疗保险94220交通87721补贴77022免费74523股票72524期权72525通讯72226班车67127全勤奖66228nan38229包吃33530住房补贴32531企业7832团建7033文化6834活动4635健身房4236生日3337奖金2738绩效奖金2239双休2140晚餐2041培训2042六险2043项目1944健身1945朝九晚1846包住1847六1848提供1849住宿17

city = pd.DataFrame(data['公司领域'].value_counts().reset_index())
city = city.rename(columns={'index':'公司领域','公司领域':'数量'})[:15]
plt.figure(figsize=(16, 6.5))
plt.rcParams["font.family"] = 'Arial Unicode MS'
plt.bar(city['公司领域'], city['数量'])
plt.xlabel('公司领域')
plt.ylabel('数量')
x=np.arange(15)

y=np.array(list(city['数量']))
for a,b in zip(x,y):
    plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=12)
plt.title('数据分析公司领域的直方图分布')
Text(0.5, 1.0, '&#x6570;&#x636E;&#x5206;&#x6790;&#x516C;&#x53F8;&#x9886;&#x57DF;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x5206;&#x5E03;')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0TLyTE3J-1641306756606)(output_15_1.png)]

总结

专栏学习

01 【数据分析实战项目】: 无人智能售货机商务分析线上课程智能推荐学术前沿趋势分析

02 【算法–数据挖掘】: 机器学习—-吃瓜教程!集成学习深度学习 学术前沿趋势分析

03 【天池数据挖掘竞赛】: 心电信号多分类分类新闻推荐入门赛系统项目

04 【Python数据分析】: Numpy 数值计算基础Matplotlib 数据可视化基础Pandas 统计分析基础Pandas 进行数据预处理scikit-learn 构建模型

往期精彩内容

01 【常见的数据分析师的面试问题】: 基础知识考查、概率论与数理统计、数据挖掘、常见模型介绍、数据分析师工作必备技能等等

02 【基于条件随机场模型的中文分词】: 中文分析、python代码实现

03 【 Github开源项目】: Github开源项目 数分/数挖学习路线

欢迎关注我,一起交流学习探索数据分析的世界,洞察数据!努力接受社会毒打~~

@翀- 我的博客主页

Original: https://blog.csdn.net/jcjic/article/details/122313320
Author: 数据闲逛人
Title: Boss直聘招聘数据分析岗位小分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/600742/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球