数据挖掘求职岗位要求分析

研究数据挖掘有三方面原因:

1. 与研究方向相契合——复杂网络中的传播。包括谣言、舆情、病毒在复杂现实网络或虚拟网络的传播。经过一年摸索明白主要科研步骤基本是建模、再建模。如果想把模型在实际社交网络稍加应用,就面临需要系统学习,不是列几个公式、不求甚解地翻两本书能搞定的。需经过数据的搜取(调用新浪API、网络爬虫)、清洗、整理、预处理。

2. 经验相对保值。各大IT、金融公司均有数据挖掘这一岗位,并且有持续深入研究的职业价值。大多数人认为程序员是吃青春饭的职业,那么数据挖掘则是程序员中的中医。如果做前端,一两年后可能转做大前端、继续技术之路;或者可以跳槽到创业型公司谋出路。然而很少听前端程序员被聘请为CEO或者COO,但是却有首席数据官(CDO)这一岗位。而且前端门槛低,竞争对手多。

3. 深度和广度兼备。不仅要求技术到位,对社科、金融等其他领域也要有所了解。

一、 在数据分析、挖掘方面,有哪些好书值得推荐?

做数据分析不得不看的书有哪些?

书籍是必备的,相比帖子、博文更系统透彻。有视屏教程就更好了。

入门读物:

  1. 深入浅出数据分析 (豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。
  2. 啤酒与尿布 (豆瓣) 通过案例来说事情,而且是最经典的例子。难易程度:非常易。
  3. 数据之美 (豆瓣) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。
数据分析:
  1. Python for Data Analysis (豆瓣) 作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!
  2. Bad Data Handbook (豆瓣) 很好玩的书,作者的角度很不同。
适合入门的教程:
  1. 集体智慧编程 (豆瓣) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。难易程度:中。
  2. Machine Learning in Action (豆瓣) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: 王斌_ICTIR)已经翻译这本书了 机器学习实战 (豆瓣)。这本书本身质量就很高,王老师的翻译质量也很高。难易程度:中。我带的研究生入门必看数目之一!
  3. Building Machine Learning Systems with Python (豆瓣) 虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。
  4. 数据挖掘导论 (豆瓣) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。
  5. 《R in Action-Data Analysis and Graphics with R》R语言实战 (豆瓣) R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。

二、工具和实战

SAS、SPSS、R语言

数据分析和挖掘有哪些公开的数据来源?

项目实践:Kaggle Competitions 从最下面的101开始,逐级往上

三、各大公司招聘要求

腾讯微信海量数据平台
工作要求:
计算机、统计学、数学等相关专业本科及以上学历;
具有扎实的统计学、数据挖掘知识。熟悉数据仓库和数据挖掘的相关技术细节,能够熟练地使用SQL/Hadoop等产品;
2年以上海量数据挖掘、分析相关项目实施经验,参与过完整的数据采集、数据清洗整理、分析和建模工作;
对商业和业务逻辑敏感,有互联网相关行业背景,有复杂网络研究和推荐系统经验优先;
具备良好的逻辑分析能力、组织沟通能力和团队精神,充满激情,乐于接受挑战。
亚马逊中国Python数据挖掘实习生
任职要求: 
1、能确保每周至少4个工作日,至少保证3个月的实习期。 
2、熟练掌握Python编程,有一定项目经验 
3、熟练掌握MySQL或Oracle data base; 
4、有一定的数理统计基础 
5、能有效管理有限的时间; 
6、工作态度积极,能在压力下工作。 
建议专业:管理科学与工程,工业工程,计算机科学,软件工程,统计,应用数学。 
平安保险精算部——精算部数据挖掘实习生
岗位要求:
1、在读硕士研究生,可确保实习至少3个月以上;
2、数据挖掘、数学、精算、计算机等相关专业,有数学建模,海量数据统计分析相关项目经验优先;
3、具有统计数据分析的基本技能,熟练使用Excel,具有一定的SQL,SAS编程基础;
4、具备较强的责任心和团队精神、有较强的学习能力、沟通能力和创新意识,以及一定的文字功底;
腾讯
工作地点主要有深圳、北京、成都、上海、广州等。
具体要求:
计算机、统计、数学、信息技术等相关专业本科以上学历;
既有商业敏感度何丰富的数据挖掘项目操作经验;
又能熟练使用R/SAS/matlab等至少一种数理统计、数据分析工具软件,使用常见的编程工具进行开发。
3-5年相关工作经验。
深圳小恩爱
职位要求
计算机、统计、数学相关专业本科及以上学历。
3年以上数据挖掘相关项目经验,参与过完整的数据采集、数据清洗、数据分析和建模工作,负责过数据挖掘的实际线上应用项目。
熟练掌握数据分析体系架构、方法和相关数据建模、数据挖掘理论,拥有完整的数据平台建设和数据挖掘开发经验。
有BI系统架构经验、深厚数理专业基础或数据挖掘深度研究经验者优先。
深圳迅雷云加速数据挖掘高级工程师
任职资格:
本科及以上学历,数理统计或数据挖掘专业方向;
3年及以上推荐系统,广告算法等相关工作经验;
熟悉Bash/Perl/Python相关脚本语言;
熟悉Hapoop,Hive,Mahout相关技术;
有互联网行业数据挖掘经验者优先;
360安全卫士
岗位描述:
1.负责用户行为挖掘
2.负责榜单类数据
3.负责音乐的相关性模型训练
4.负责音乐推荐类数据挖掘
5.负责云盘音乐数据的筛选
6.负责小说中垃圾数据挖掘
任职要求
1、熟悉数据挖掘、机器学习相关常见算法,熟悉hadoop等分布式开发平台,有大数据处理项目经验
2、语言类别不限
腾讯网页转码和数据挖掘算法工.
任职要求:
本科及以上学历;
2年以上相关工作经验;
对网页HTML解析和DOM树处理有一定的了解,能够从网页结构和数据分析中发现有价值的信息,或对数据分类、数据聚类以及用户推荐算法有一定的了解,能够从海量用户数据中发现有价值的规律(具备一种亦可);
熟悉LINUX服务器端开发,熟悉C++和常用LINUX脚本;
如有网页转码和据挖掘方面的常用算法和技巧的优先考虑。
腾讯管理部招聘数据挖掘(anti-spam)
职位要求
计算机或相关专业本科以上学历,2年以上相关工作经验;
丰富的数据分析经验以及恶意对抗实战经验;
责任感强、有较强的逻辑思维能力、沟通能力和抗压能力;
熟悉C/C++开发,有一定的架构能力和良好代码规范;
熟悉linux/unix系统与开发环境;
熟悉mysql以及SQL语言
珍爱网
岗位要求:
1、数学、统计学、计算机等相关专业背景,本科及以上学历,2年以上数据挖掘、机器学习工作经验;
2、具备较强独立思考能力,对数据敏感,热衷从数据中发现规律;
3、熟悉各种分类和聚类算法;
4、熟悉数据挖掘建模流程,熟悉SAS/Clementine/R/python之一进行建模,熟悉SQL
5、具有互联网、咨询公司、银行、电信行业经验者优先
上海AvazuR&D
1、通过海量数据挖掘、机器学习等方法进行核心策略的研究及开发;
2、用户分析、理解及建模,持续提升用户产品体验;
3、高性能、高并发的机器学习、数据挖掘方法及架构的研发;
4、算法及数据挖掘在新业务领域的推进及应用。 
在路上技术中心招聘数据挖掘实习生:5K-10K
岗位要求:
本科以上在校生,计算机相关专业,对大数据,海量数据处理有浓厚兴趣
有自己擅长的开发语言和科学技术语言
掌握常用的 ML 算法、常见推荐算法(如,协同过滤、分类、聚类、SVM 等),并有较强的算法实现能力
有团队精神、有担当、敢于挑战自我
优先条件:
有自然语言处理、搜索引擎网络爬虫相关实战项目经验
有数据挖掘、自然语言处理、信息检索、机器学习背景
985 高校优先
深圳房多多——3-5年经验——12k-24K
1、对机器学习、数据挖掘算法及其在互联网行业的应用,有比较深入的认识和理解;
2、熟悉Java/R/Hadoop等,较强的算法实现能力;
3、3年以上推荐算法/机器学习/数据挖掘相关工作经验
4、严密的数学思维、突出的分析和归纳能力、优秀的沟通表达能力;
5、有推荐系统、定向营销、电子商务、信息处理、信息检索等方面的建模经验优先。

杭州铜板街——3到5年经验——12k到24
1. 精通SQL,熟悉一门脚本语言(Python/shell等等)
2. 对常见数据挖掘算法有一定了解(包括不局限于线性回归、决策树、随机森林、聚类、近邻等等)
3. 最好有过完整的建模经验(数据预处理、变量筛选、模型建立、模型评价等等)
4. 最好有过大数据上进行数据分析或者建模的经验
1、2技能点必须,其他随意。

你可能感兴趣的:(杂栏:Linux,Win,office技术问题)