BOSS招聘网站数据分析岗位分析详情

BOSS招聘网站数据分析岗位分析详情

数据来源于BOSS招聘网站,仅供学习

中文显示及负号显示

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]
plt.rcParams[‘axes.unicode_minus’]=False

读取数据

df = pd.read_csv(‘./boss.csv’,header=None,names=[‘公司’,’职位’,’地点’,’薪资’,’工作经验及学历’,’所属行业’,’详情’])
df.head()

查看数据详情

df.info()

查看是否有重复

df.duplicated().sum()

删除重复

df.drop_duplicates(inplace=True)

确认是否删除

df.duplicated().sum()

查看职位信息

df[‘职位’].unique()

发现有找实习岗位

sx = df[‘职位’].str.contains(‘实习’)
sx.sum()

实习岗位数量较少,需进行删除

df = df[~sx]
df.reset_index(drop=True,inplace=True)
df.head()

查看地点

df[‘地点’].unique()

查看薪资

df[‘薪资’].unique()

薪资进行拆分,分为最高薪资和最低薪资

df[‘最低薪资’] = df[‘薪资’].str.extract(‘^(\d+). ‘)
df[‘最高薪资’] = df[‘薪资’].str.extract(‘^.
?-(\d+).*’)
df.head()

有些公司薪资包含有奖金,计算每个岗位的奖金率

df[‘奖金率’] = df[‘薪资’].str.extract(‘^.*?·(\d{2})薪’)
df[‘奖金率’].fillna(12,inplace=True)
df[‘奖金率’] = df[‘奖金率’].astype(‘float’)
df[‘奖金率’] = df[‘奖金率’] / 12
df.head()

计算平均薪资

df[‘最高薪资’] = df[‘最高薪资’].astype(‘int’)
df[‘最低薪资’] = df[‘最低薪资’].astype(‘int’)
df[‘平均薪资’] = (df[‘最高薪资’] + df[‘最低薪资’]) / 2
df.head()

查看薪资详情

df.describe()

剔除异常薪资

df = df[(df.平均薪资 > 3)&(df.平均薪资 < 70)]
df.describe()

查看工作经验及学历

df[‘工作经验及学历’].unique()

将工作经验和学历进行拆分

df[‘工作经验’] = df[‘工作经验及学历’].str.extract(‘^(\d+/?-\d+)’)
df[‘学历’] = df[‘工作经验及学历’].str[-2:]
df.head()

查看工作经验

df[‘工作经验’].unique()

将工作经验进行分层

df[‘工作经验’].replace(‘1-3′,’1-3年’,inplace=True)
df[‘工作经验’].replace(‘3-5′,’3-5年’,inplace=True)
df[‘工作经验’].replace(‘5-10′,’5-10年’,inplace=True)
df[‘工作经验’].replace(np.nan,’经验不限’,inplace=True)
df[‘工作经验’].unique()

查看学历

df[‘学历’].unique()

查看所属行业

df.所属行业.value_counts()[:15]

查看不同城市的平均薪资和中位数薪资

plt.figure(figsize=(14,8))
df[‘平均薪资’].groupby(df[‘地点’]).agg([‘mean’,’median’]).plot.bar()

由图可知,发现上海,北京,杭州,深圳四个城市的薪资水平远远高于其它城市,广州紧随其后

不同薪资的数量分布

plt.figure(figsize=(12,8))
plt.hist(df[‘平均薪资’],bins=30,alpha=0.6,edgecolor=’k’)
plt.ylabel(‘岗位数’)
plt.xlabel(‘薪资’)
plt.xticks(list(range(0,70,5)))
plt.show()

由图可知,少部分人拿高工资,月薪五千到一万岗位数量最多,月薪一万到三万的岗位不在少数

以平均月薪10K分段比较不同城市的占比

plt.figure(figsize=(12,8))
plt.subplot(121)
temp = df[df[‘平均薪资’]

plt.subplot(122)
temp = df[df[‘平均薪资’]>10].groupby(‘地点’)[‘平均薪资’].count()
plt.pie(temp,labels=temp.index,autopct=’%.2f%%’)
plt.title(‘薪资大于10K各城市占比’)

由图可知,北杭上广深五城市薪资大于10K共占比高达66.03%,薪资与其它城市薪资水平差异很大,底薪岗位位于苏州,及中西部城市.

不同学历的薪资情况

plt.figure(figsize=(14,8))
df[‘平均薪资’].groupby(df[‘学历’]).agg([‘mean’,’median’]).plot.bar()

由图可知,是否是本科及以上对薪资影响很大,本科和硕士薪资没有多大区别,博士薪资水平远远高于其它学历

查看学历需求情况

data = df[‘学历’].value_counts()

plt.figure(figsize=(8,8))
plt.pie(data.values,labels=data.index,autopct=’%.2f%%’)
plt.title(“各学历占比”)
plt.show()

由图可知,要求有本科学历占绝大多数,占比高达79.13%,其次是大专占比12.69%,硕士占比5.45%,而博士则是极少数

不同经验的薪资情况

plt.figure(figsize=(12,8))
df[‘平均薪资’].groupby(df[‘工作经验’]).agg([‘mean’,’median’]).plot.bar()

由图可知,5-10年工作经验薪资是最多的,应届生工资是比较低的,随着工作经验

各工作经验占比情况

data = df[‘工作经验’].value_counts()

plt.figure(figsize=(8,8))
plt.pie(data.values,labels=data.index,autopct=’%.2f%%’)
plt.title(‘各工作经验占比’)
plt.show()

由图可知,3-5年工作经验需求是最多,占比36.62%,其次是1-3年占比29.66%,1-5年工作经验占比69.28%,可想而知,市场对工作经验的要求是很强烈的,有与工作经验是成功入职的关键

不同行业的薪资情况

plt.figure(figsize=(12,8))
df[‘平均薪资’].groupby(df[‘所属行业’][:15]).agg([‘mean’,’median’]).plot.bar()

由题可知,互联网行业平均薪资比其他行业较高,其次是电子商务,在线教育和其他服务业平均薪资较低

各行业占比

data = df[‘所属行业’].value_counts()

plt.figure(figsize=(8,8))
plt.pie(data.values,labels=data.index,autopct=’%.2f%%’)
plt.title(‘各行业占比’)
plt.show()

由图可知,互联网行业和电子商务对数据分析岗位的需求非常大,占比达57.94%,同时薪资水平相比其他行业较高,而其他行业相对来说需求较少,薪资也低一些.

岗位要求词云图,发现一些意义不大的字段,需要剔除

from wordcloud import WordCloud

text = df[‘详情’].dropna().to_string()
text = text.replace(‘数据分析师’,”)
text = text.replace(‘数据分析工程’,”)
text = text.replace(‘数据分析专员’,”)
text = text.replace(‘数据分析’,”)
plt.figure(figsize=(8,6))
wordcloud = WordCloud(font_path=’simhei.ttf’,
background_color=’white’,
min_font_size=10,
color_func=lambda args,*kwargs:(0,0,0),
width=900,height=600).generate(text)

plt.imshow(wordcloud)
plt.axis(‘off’)

此图显示各个企业对数据分析师职业技能需求的关键字。数据挖掘,商业分析,python,数据仓库,SQL,建模,大数据是最需要的技能

总结:
通过以上分析,可以发现,如果要成功转行,应该去北上广深杭这几个城市发展,这些城市的薪资水平较高,
需求量较多,特别是互联网行业和电子商务,胜任岗位所需要的相关技能是很重要的,
工作经验对于岗位而言是非常重要的,能否成功转行的关键门槛在于是否有工作经验,也和薪资水平呈正相关,
而转行以后,只要迈过3年这个坎,才会有比较大的突破.

Original: https://blog.csdn.net/weixin_50883445/article/details/114439689
Author: 人生苦短,我用python!
Title: BOSS招聘网站数据分析岗位分析详情

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/740402/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球