拉勾网北京Java职位信息采集与简单薪酬统计

上周为了练习写Java程序,编了个采集拉勾网职位信息的小软件。采集了北京的java相关职位(3月8日之前),并把职位信息汇总成表,输出到一个网页。

来源地址:

http://www.lagou.com/jobs/list_Java?kd=Java&spc=0&pl=&gj=&xl=&yx=&gx=&st=&labelWords=label&lc=1&workAddress=&city=%E5%8C%97%E4%BA%AC)。


然后为了练习,又写了网页相应的javascript的程序,可以右键菜单对表按薪酬等进行排序,隐藏、显示任意列。(只在最新版chrome测试,ie8之前无法运行。)

网页和js、css文件上传到了代码分享区,地址:http://www.oschina.net/code/snippet_1382972_33983


首先按照职位的薪水下限进行了统计,数据如下:


共175家公司发布了302个职位 。

起薪 职位数 此薪水以上的职位数占总职位数的百分比
1k 1 100%
2k 1 100%
4k 6 99%
5k 17 97%
6k 23 92%
7k 9 84%
8k 55 81%
9k 12 63%
10k 84 59%
11k 2 31%
12k 20 30%
13k 4 24%
14k 3 23%
15k 49 22%
17k 1 5%
18k 4 5%
20k 11 4%


2、然后使用谷歌浏览器的ctrl+f,统计了下职位要求中一些关键词的出现次数:

关键词 出现次数
MYSQL 184
Oracle 107
DB2 15
SqlServer 44
PostgreSQL 6
Sybase 2
Nosql 26
Redis 37
Hadoop 36
MongoDB 23
Hbase 8
Hive 5
PIG 2


Hibernate 116
Ibatis 75
Mybatis 30
JDBC 15


Ssh 20
Struts 116
Spring 203
Mvc 72
Javaweb 11
Servlet 40
Jsp 52
JSF 3
WebWork 5


Freemarker 15
Velocity 7


SOA 15
Restful 5
Web Service 18
OSGI 5


Memcached 24
Lucene 29




Ant 11
Maven 28
SCM 2


Junit 3


Tomcat 98
Resin 23
Jboss 24
WebSphere 16
WebLogic 32
Jetty 4


Nginx 30
Apache 28


Eclipse 41
IntelliJ 4
UML 33


SVN 32
Git 9
CVS 11
JVM 20


TCP/IP 28
HTTP 35
Socket 16


Javascript 110
Jquery 73
Bootstrap 10
Prototype 3
Nodejs 3
Ajax 8
JSON 15
CSS 68
Xml 39
Linux 165
Shell 42
Python 23


Android 24


算法 57
多线程 47
框架 258
开发模式 11
Web 246


附广告一枚:本人正在求职,找北京的Java相关工作,如有合适职位可以给我留言。


你可能感兴趣的:(拉勾网北京Java职位信息采集与简单薪酬统计)