数据挖掘(data mining)招聘要求Checklist

昨一姐们儿说离今年结束还有288天,时间过得飞快,顿感危机。为了毕业能找到一份好的工作真不容易,遂列计划自查,希望能在今年完成主要内容的学习。。。但是真的好多,压力好大啊。。。对了,那今天不只剩下287天了么,可怕。

数据挖掘(data mining)招聘要求Checklist_第1张图片
Data Mining

早上起床的时候也不知到为什么突然灵光一闪,想到去网上看一下各个IT公司的招聘要求,看看自己以后能够去什么公司,不然万一以后找不到工作怎么办。因为一些乱七八糟的原因,导致研究方向从本来计划的健康和生物信息Health and Biomedical Information(丫的竟然好久没写,生物都快拼不来了)转到了数据挖掘Data Mining,感觉又回到老本行了,真是捉弄人,但也算是差强人意,数据挖掘还是蛮有意思的T-T,我讨厌数学!!!!

这年头,要找份好的工作,要求那么高,那么怎么能让自己被国内较好的互联网公司看上呢,当然是参考行业内要求最高的公司的要求来对自己的知识系统查漏补缺喽,遂去找了Facebook和Google相关工作的Requirement,又去看了一下国内的BAT的招聘要求。说实在的,BAT的招聘要求大多比较模糊,参考意义较小,可能在招聘环节中的软实力和HR心情影响比重会比较大吧(顺带吐槽一下阿里,曾眼睁睁看着一技术大牛因为性格不被HR喜欢而被刷去了Google,当时一技术主管知道差点气吐血。。)

说了那么多废话,还是进入正题。要求的checklist来自几家公司的结合,一条一条自己对过去,竟然没有一条自己能完全符合上。。。压力大啊,注定是艰苦的一年。

应用能力

总的来说,数据挖掘和数据分析最后的目的都是为了洞察商业动向,帮助管理者做出决策,所以一个好的数据分析师,需要比较强的商业洞察能力,这么说来,一个管理出生的技术人员好像竟然挺适合干这行的。

  • 写报告和商业洞察力:Design and implement reporting dashboards that track key business metrics and provide actionable insights
  • 数据管理计划:Manage data warehouse plans for a product or a group of products. 暂时不太懂,没有这方面的经验,可能需要看更多关于此方面的文章和一些企业的文件管理计划。目前能够确定的一个方向是Git应该是在这个要求会比较有用的技能。
  • Support critical data processes running in production.

数据处理能力

  • Experience utilizing both qualitative analysis (e.g., content analysis, phenomenology, hypothesis testing) and quantitative analysis techniques (e.g., clustering, regression, pattern recognition, descriptive and inferential statistics):两种数据挖掘能力,一种是对数据进行描述,主要使用聚类(cluster),碎片化(Segementation )和总结(summarize);一种是对数据进行预测,主要使用分类(Classification)和回归(Regression)。
  • data models and data processes:数据模型及处理,data structure?数学建模?下次去问一下上过高级数据模型(advanced data model)的姐们儿要一下课件。
  • Perform large-scale data analysis and develop effective statistical models for segmentation, classification, optimization, time series, etc. 这个就是数学建模能力,了解统计学上的几个基础模型应该能应付。

基础IT能力

基本的IT能力当然是现在的数据挖掘和数据分析师必备的能力喽。但是,欸,要求有点多欸。。。

  • systems software:不知道说的是不是软件构架还是商务信息系统。
  • algorithms:重新再去看以前的算法书,烦人!
  • Unix/Linux and APIs:做IT为什么一定要学Unix,我真的不懂啊,以前看过老早忘光了。
  • TCP/IP and network programming:上学期选了一门高级网络技术课,虽然拿了HD,但是讲真,我已经忘了网络结构是什么了。。。汗颜。。。对不起李伟。
  • C++, Java and/or Python:C++学过,三年没写了;Java要系统学习下;Python这学期又要用。。。目前优先学Python,再学一下Java,再补习C++吧。
  • SQL, PLSQL* - relational database:这个我超懂!!!但还是找本书来复习下。
  • Configuration and maintenance of common applications such as Apache, memcached, Squid, MySQL, NFS, DHCP, NTP, SSH, DNS, and SNMP:欸,安装和维护这些常见应用。。。除了Apache和MySQL,后面是什么东西都不知道。。。

IT管理能力-internal service architectures

没有接触过内部服务框架的管理,只有以前听说过数据分布式储存之类的知识。

  • Ability to perform 'guerrilla capacity planning' for internet service architectures:内部服务框架,好像这学期的service management and engineering就是在讲这个内容,但是印度老师的口音飘着弄弄的咖喱味,让人手不太了,感觉每节课都在做听力。
  • Knowledge of basic large-scale internet service architectures (such as load balancing, LAMP, CDN's):不懂,以后再学吧。

学习计划

刚才再认真地看了一下全部的要求,简直。。好像我怕是一门都过不了关,要好好学习好好学习啊!!!!!!!对每个要求的重新学习都总结成文作为将来复习用的资料。其实上述大半的内容我都接触过,当时还学的不错,但是知识这东西就是这样,你一年半载不去用它,就忘光了,以后学习笔记还是要做,并整理成文章进行管理,以后有助于忘了以后的快速复习!!!!

好吧,计划中学习的优先级,考虑到这学期课业真的挺繁重的,先学好数学挖掘方向的内容吧(python,线代,概率统计,数据挖掘)。

不说了,继续被线代和统计学虐去了。。。暂时做完已经开动的“精神性疾病”的专题之后,暂时不再开动其他领域的大专题了,还是要务好正业啊,哎。

加油!

你可能感兴趣的:(数据挖掘(data mining)招聘要求Checklist)