2013年7月巴里巴巴数据平台研发职位分享

   以下是7月初阿里巴巴数据平台事业部研发类职位分享,求扩散,职位都是P6-P9,看候选人资历而定,有兴趣请发资料到:[email protected]。谢谢!!

阿里巴巴紧急职位

资深Java开发工程师

资深数据开发工程师(ETL

资深数据开发工程师

ODPS框架测试工程师(B

ODPS框架研发工程师(B

资深前端开发工程师

资深数据挖掘工程师

资深平台研发工程师/资深JAVA工程师

数据架构师

资深实时计算研发工程师

数据挖掘及统计算法研发

大数据算法专家/工程师

分布式数据库开发工程师

资深Java开发工程师 

岗位描述:

1、负责大数据平台DXP平台部分模块的系统架构设计、产品开发与交付等工作;

2、负责大数据平台持续集成相关工具平台的架构设计与产品开发等工作;

3、帮助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关;

岗位要求:

1JAVA基础扎实,熟悉io、多线程、集合等基础框架,熟悉分布式、缓存、消息、搜索等机制;

2、五年以上使用JAVA进行web开发的经验;精通AOPMVC等框架。熟悉web开发的相关技术:html/javascript/ajax/xml等;

3、熟悉JAVA EE规范,熟悉常用的设计模式;精通JavaWeb的开发和应用;熟悉高并发、高性能的分布式系统的设计及应用、调优;

4、熟悉消息中间件的原理及应用,熟悉缓存框架的原理及应用;

5、熟悉SQL,了解Oracle等大型数据库;

6、熟悉Linux下的常用命令;

7、有强烈代码质量意识的优先考虑。

资深数据开发工程师(ETL

岗位描述:

1. 基于ODPSHadoop,整合和处理海量数据;

2.建立数据交换价值基础内容,实现数据业务价值体现过程;

3.负责分布式数据平台框架下的数据开发架构设计和开发以及新数据应用开发架构研究;

4. 参与数据模型体系构建及数据主题设计和开发。  

岗位要求:

1. 计算机或相关专业本科以上学历;

2. 3年以上数据仓库开发(精通SQL)经验,1年以上云计算平台的应用开发经验;

3. 熟悉HadoopHive,理解云计算,对HadoopHive源码有研究优先;

4. 精通JAVA或者Python,有并发应用或者分布式应用软件开发经验;

5. 熟练掌握Linux常规命令与工具,能编写一定难度的Shell

6. 良好的系统分析、架构设计能力,有独立设计分布式数据开发框架经验优先;

7. 对数据敏感、对新技术敏感,有一定技术研究能力;

8. 性格积极乐观,诚信,有较强的语言表达能力;具备强烈的进取心、求知欲及团队合作精神。

 

资深数据开发工程师

岗位描述:

1、 基于ODPSHadoop,整合和处理海量数据;

2、 建立数据交换价值基础内容,实现数据业务价值体现过程;

3、 负责分布式数据平台框架下的数据开发架构设计和开发以及新数据应用开发架构研究;

4、 参与数据模型体系构建及数据主题设计和开发。 

岗位要求:

1、 计算机或相关专业本科以上学历;

2、 3年以上数据仓库开发(精通SQL)经验,1年以上云计算平台的应用开发经验;

3、 熟悉HadoopHive,理解云计算,对HadoopHive源码有研究优先;

4、 精通JAVA或者Python,有并发应用或者分布式应用软件开发经验;

5、 熟练掌握Linux常规命令与工具,能编写一定难度的Shell

6、 良好的系统分析、架构设计能力,有独立设计分布式数据开发框架经验优先;

7、 对数据敏感、对新技术敏感,有一定技术研究能力;

8、 性格积极乐观,诚信,有较强的语言表达能力;具备强烈的进取心、求知欲及团队合作精神。

 

ODPS框架测试工程师(B

岗位要求:

1.            Java/Python/Shell等编程经验;

2.            Linux有使用经验,能查看服务器的各种设置,判断服务器的稳定、性能状态;

3.            精通各种测试框架,熟悉白盒测试理论,具备较强的系统性能测试、分析与调优能力;

4.            有归纳总结的能力;

5.            能和研发人员打成一片,正面影响研发人员的研发习惯;

6.            钻研精神, 对技术工作充满热情和团队精神,愿意投身大数据事业。

更多职位信息,请前往:http://www.aliway.com/read.php?fid=38&tid=167151&page=e

更详尽的团队介绍,请前往:http://www.alidata.org/

岗位描述:

ODPS(Open Data Processing Service)是一套分布式海量数据处理服务,其主要包括2大块:

1.  各种TaskSqlTask(用户可以提交Sql实现业务逻辑)MRTask(用户可以提交Java MapReduce 实现业务逻辑)DTTask(可以在不同数据源(ODPSPanguHDFSOralceMysql等)之间搬迁数据,在搬迁的过程中因采用Fuxi job而大大提高性能)等

2.  ODPS框架:抽象了一套核心对象模型(ProjectResourceTableJobTaskRegistrationNotification等),负责把各种TaskRESTFul API方式提供服务,框架实现安全、持久化、调度、流控、Failover等,让Task只关注自己的逻辑。为了用户使用方便,框架还提供SDK/Console。为了让ODPS可管理、可运维,ODPS框架还会有一个基于webAdmin Console

ODPS框架测试工程师主要参与上面第2块的测试规划、测试case设计、case实现、自动化回归。

如果你想知道大数据在ODPS平台上如何计算,如果你想知道数据如何服务商业,如果你不想错过大数据时代,想到不如做到,快联系我们吧!

 

ODPS框架研发工程师(B  

岗位描述:

ODPS(Open Data Processing Service)是一套分布式海量数据处理服务,其主要包括2大块:

1.  各种TaskSqlTask(用户可以提交Sql实现业务逻辑)MRTask(用户可以提交Java MapReduce 实现业务逻辑)DTTask(可以在不同数据源(ODPSPanguHDFSOralceMysql等)之间搬迁数据,在搬迁的过程中因采用Fuxi job而大大提高性能)等

2.  ODPS框架:抽象了一套核心对象模型(ProjectResourceTableJobTaskRegistrationNotification等),负责把各种TaskRESTFul API方式提供服务,框架实现安全、持久化、调度、流控、Failover等,让Task只关注自己的逻辑。为了用户使用方便,框架还提供SDK/Console。为了让ODPS可管理、可运维,ODPS框架还会有一个基于webAdmin Console

 

岗位要求:

1.  精通C++或者Java,有Linux下丰富的开发经验,精通性能调优;

2.  对分布式计算有一定的研究,并有丰富的相关开发经验;

3.  具备良好的研发习惯(比如:UTFTCode Review)

4.  钻研精神, 对技术工作充满热情和团队精神,愿意投身大数据事业。

 

 

资深前端开发工程师

岗位描述:

1、 前端框架的设计与实现;

2、 各业务模块前端代码开发;

3、 平台易用性与用户体验的持续改进;

4、 Web前沿技术研究和新技术调研。

岗位要求:

 

1、 精通Web前端技术, 包括HTML/CSS/Javascript等;

2、 精通JS对象编程, 并能熟练使用jquery进行动态网页开发;

3、 有基于AjaxJsonp的开发经验;

4、  NodeJS / Html5 及其相关技术有一定了解;

5、 技术视野广阔, 乐于不断学习新知识与新技术, 并能应用到实际工作中;

6、 个性乐观开朗, 逻辑性强, 善于和各种背景的人合作。

资深数据挖掘工程师

背景:

在这里我们面对的不再是噪音高、非结构化信息比重大、商业价值偏低的数据;面对的将会是真实的交易数据; 亿级别消费者的商业行为,数百万级电商经营策略供你研究。我们不单单做基于分布式环境的离线算法实施, 同时我们也会面对海量数据下实时增量算法实施的挑战,如果你对这些有兴趣,请加入我们。

岗位描述:

1、 应用机器学习、文本挖掘等技术,对海量数据进行挖掘,发现其潜在关系,指导业务发展;

2、 构建通用的分布式环境下算法平台,包括矩阵计算、变量构造、算法封装,快速支持算法应用;

3、 通过海量商业数据实施用户画像、行业研究、卖家分析、商品挖掘等项目;

4、 协助并指导新人完成相关数据挖掘项目。

岗位要求:

1、 数学、统计、计算机等相关专业硕士及以上学历;

2、 三年以上海量数据下机器学和算法实施相关工作经验;

3、 对聚类、分类、矩阵计算原理其中之一理解透彻;

4、 熟练掌握JAVA编程语言,熟悉Linux/Unix平台上的开发环境;

5、 熟悉分布式系统(Hadoop)和算法设计,以及增量算法实施经验。

 

资深平台研发工程师/资深JAVA工程师

背景:

设计,开发集团的的海量数据开发平台.开发平台整合海量数据处理和管理,高效任务调度,快速流式计算,灵活数据查询,高级数据挖掘,智能数据展现,科学智能评估等技术。帮助平台用户快速构建基于大数据的数据产品和应用。通过平台帮助用户实现商业智能。将大数据快速转变成商业价值。

岗位描述:

1、 不限语言,不限前后端,只要你能用能够并且乐于编写健壮,优雅,易于扩展和维护的代码;

2、 快速的学习能力,优秀的分析、解决问题能力。良好的抽象归纳能力和创新能力;

3、 至少需要在以下一个或以上方面表现优秀:架构设计/数据结构与算法/产品设计/项目管理;

4、 至少对以一个或者以上领域非常熟悉并有所积累:JS框架技术/高性能web/SOA/数据仓库/海量数据处理;

5、 有强烈的责任感,性格成熟稳定,对承诺负责。

6、 岗位要求:

1、 主导或者参与过HadoopHiveHBase等系统研发者;

2、 熟悉数据分析,数据挖掘理论技术和实践经验,有BI系统建设经验者;

3、 熟悉云计算和虚拟化相关技术,具有系统级/平台级开源项目开发或使用经验,特别是OpenNebulaOpenStack

4、 主导和参与过开源项目的加分(请在简历中提供项目链接)

5、 长期更新和维护技术blog者或者有大量技术类读书笔记者优先;

6、 对产品设计有兴趣者优先。

 

 

数据架构师

岗位描述:

1、 关注客户在高效使用数据,深度挖掘数据价值,进行数据化运营转型过程中遇到的任何问题,并进行抽象总结,牵头统筹协调各个数据开发团队和运维团队;

2、 有效的从根本上解决用户共性问题,制定核心技术全局方案并进行难点攻关,让客户能够清楚明白有效的使用整个集团的数据基础设施来促进业务的发展;

3、 为客户提供一揽子解决方案,帮助客户成长,让各个数据开发团队知道并了解客户最重要的需求,引导数据开发团队的产品方向,了解各自数据开发团队在解决客户问题中所起的作用和需要承担的职责,让数据团队的价值真正落实到客户需要的地方。

岗位要求:

1、 熟悉各子公司数据业务和数据技术架构。善于从复杂现象中抽象根本问题,分析根本原因,并形成最合适的快速解决方案;

2、 熟悉Data Warehouse实施方法,精通各种ETL处理的各种技术。熟悉分布式计算的设计,了解在工程化过程中会遇到的各种问题,熟悉HadoopHive,飞天,ODPS等系统并有过实战经验;

3、 对调度系统,元数据系统有非常深刻的认识和理解,能解决高并发的调度系统中的关键问题;

4、 熟悉Oracle MySQL数据库,能综合用JavaPythonShell等语言来解决遇到的各种技术问题;

5、 熟悉端到端的最优数据实施的丰富实战经验,具备强烈的技术创新的意识和能力;

6、 善于多团队合作并形成结果,并具备从全局思考问题的习惯,推动多个子公司共赢。

 

资深实时计算研发工程师

岗位描述:

1、  MapReduce范式的海量数据的离线处理大家已经非常熟悉了,随着业务的发展,目前大量的数据应用需要对海量数据进行在线的实时处理和计算,你将会参与打造支撑海量数据的高性能在线实时计算引擎,提供友好的类SQL开发接口,并不断优化其计算性能;

2、  大量业务对复杂计算的实时性有越来越高的要求,这就要求系统与ad-hoc query(计算在query时发生)处理有所不同,即计算在数据进入(变化)时发生,这就需要一个高吞吐,高扩展和高可用性的服务化流计算平台,你将会参与这个平台的建设和完善,并打造业界领先的流计算引擎。

岗位要求

我们欢迎对大数据事业有强烈冲动的工程师和架构师,但你需要具备一定的相关技术沉淀,它们包含但不局限于:

1、  精通JAVA或者C/C++,有Linux下丰富的开发经验,精通性能调优;

2、  对分布式计算有一定的研究,并有丰富的相关开发经验;

3、  熟练掌握各种常用数据结构和算法;

4、  精通各种高效的索引技术,有丰富的高性能计算系统开发经验者优先;

5、  精通HadoopSpark或者Storm等分布式计算系统者优先;

6、  钻研精神, 对技术工作充满热情和团队精神,愿意投身大数据事业。

 

 

数据挖掘及统计算法研发  

岗位描述:

1、数据挖掘及大规模数据统计方面的分布式计算研发。

岗位要求:

1.  相关专业硕士及以上学位;

2.  算法基础扎实, 数学功底深;

3. 具有丰富的Linux C开发经验,极强的解决问题能力;

4. 熟悉MapReduce编程或MPI编程;

5.有较强的沟通能力和团队合作精神;

6.有统计建模经验、或SAS经验、或R语言经验者优先考虑;

7.在线性规划或图算法领域有经验者优先考虑。

 

大数据算法专家/工程师  

岗位描述:

1. 负责解决面向大数据平台的金融风险建模问题,搭建金融模型与大数据之间的桥梁;

2. 针对阿里金融风险建模的业务需求,开发设计面向海量数据平台的高可扩展/高效的统计分析算法;

3. 基于淘宝/天猫/B2B的海量数据,开发设计高可扩展的机器学习算法挖掘用户社会关联关系及行为特征。

岗位要求:

1. 有从事机器学习、数据挖掘、统计分析、广告推荐等算法相关的项目经验,熟悉常见的概率统计、数据挖掘、机器学习算法;

2. hadoop/hiveMapReduce编程或MPI编程有一定的了解;

3. 有较强的动手实现能力及学习能力,熟悉java者尤善;

3. 有统计建模经验、或SAS经验、或R语言经验者加分;

4. 有良好的沟通能力和团队合作精神。

 

分布式数据库开发工程师

岗位描述:

电子商务类数据的规模随着社会和技术的发展越来越多。这些数据既有离线分析的数据,也有在线查询的数据,如何能够在万台服务器、数十PB数据、多地情况下使用数据,并且建立好在线和离线统一的生态数据系统,成为未来技术的一大难点。部门己经成功为阿里集团多个部门优化和维护了HBase数据库,但仍然有非常多的工作需要去做,例如容灾、备份、流量均衡、跨机房、资源隔离、事务与索引、最优化成本等等。我们致力于发掘海量在线数据的应用前景,需要您既拥有丰富的理论知识,也有踏实的技术落地能力,愿意让自己的代码为千千万万用户服务。

1、分布式数据库的开发、优化和维护;

2、对现有各种产品的调优、瓶颈和场景分析、整合;

3、通过软硬件、算法的分析和优化,快速利用PB级在线数据为最终用户服务;

4、跟踪先进的技术和理论,并且主动推动跨部门合作来落地实现它们。

岗位要求:

1、有分布式系统理论与实践经验;

2、具有较强编程能力,熟悉JAVA/C/C++其中一种语言,Python/Perl/Clojure等语言熟悉者优先;

3、熟悉Linux/Unix操作,熟悉基本的Shell脚本;

4、有开源社区贡献者优先,hadoop/hbase源码熟悉者优先;

5、技术驱动型,有强烈技术热情。

你可能感兴趣的:(java,etl,研发,阿里巴巴数据平台)