Python程序员是怎么找工作的?怎么最快时间找到自己想要的工作?
前言
从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。
本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。
一、主要分析步骤
数据读取
数据整理
对职位数量在全国主要城市的分布情况进行分析
对全国范围内的职位月薪情况进行分析
对该职位招聘岗位要求描述进行词云图分析,获取频率最高的关键字
选取两个城市,分别分析月薪分布情况以及招聘要求的词云图分析
二、具体分析过程


读取数据

结果如图1所示:

2 数据整理
2.1 将str格式的日期变为 datatime

2.2 筛选月薪格式为“XXXX-XXXX”的信息

2.3 分割月薪字段,分别获取月薪的下限值和上限值


将数据信息按职位月薪进行排序

判断爬取的数据是否有重复值


从上述结果可看出,数据是没有重复的。
3 对全国范围内的职位进行分析
3.1 主要城市的招聘职位数量分布情况


对结果进行绘图:

运行结果如下述饼图所示:

3.2 月薪分布情况(全国)

运行结果如下述图所示:

不考虑部分极值后,分析月薪分布情况

运行结果如下述图所示:

3.3 相关技能要求


对获取到的职位招聘要求进行词云图分析,代码如下:

得到结果如下:

4 北京
4.1 月薪分布情况

参考全国分析时的代码,月薪分布情况图如下:

4.2 相关技能要求


词云图如下:

5 长沙
5.1 月薪分布情况

参考全国分析时的代码,月薪分布情况图如下:

5.2 相关技能要求


词云图如下:

之后的也就不一一举例了