TwoSigma, Uber Seattle, Alluxio HQ: Alluxio meetup三连

3月25日, Alluxio将在纽约曼哈顿下城和TwoSigma的数据科学家们举办一次meetup活动来介绍TwoSigma里基于Spark/Alluxio/HDFS的数据软件栈。成立于2001年的Two Sigma是华尔街顶级对冲基金,管理着超过510亿美元资产(2017年数据)。Two Sigma的名字来自于小写的sigma(σ, 投资回报的波动)和大写的Sigma(Σ, 表示求和)。从这个名字就不难看出其对算法和模型的重视。实际上Two Sigma一向以大量采用算法和数据驱动的金融黑科技而著称,大量实践了大数据和AI领域里最新的架构和系统。本次meetup的主题"Achieving compute and storage independence for data-driven workloads",就是介绍Two Sigma如何在计算和存储分离的架构下,使用Alluxio来有效的组织和管理数据,使其更好的利用计算资源的经验。

点击3月25日纽约市Two-sigma的meetup的报名连接

而3月18日, 在西雅图的Uber Office,还有一场同样精彩的主题为“Efficient & Secure Big Data Analytics: Perspectives from Uber, Alibaba, & Alluxio”的meetup。最近几年,Uber和Alibaba都非常积极和频繁的活跃在Hadoop以及相关大数据开源软件领域。 Uber最近的Hoodie等工作的影响力很大。Alibaba更是因为收购Data Artisans并宣布将Blink合并回Flink upstream,以及昨天刚刚宣布的Caffe的作者贾扬清大神的加盟(Zhihu相关问题链接),一举站在了开源社区的C位。本次meetup也将围绕着如何使用开源软件构建更安全高效的数据访问来展开,具体包括:

  • 来自Uber的工程师将介绍他们在Hadoop系统中如何加入更精细的访问控制。
  • 来自Alibaba的工程师将介绍他们在ORC (Hadoop生态圈中的常用的列式存储格式)上的最新工作
  • 我将代表Alluxio介绍如何构建Alluxio作为一层分布式的数据接入层,在设计和实现上的挑战,在实战中的使用建议

点击3月18日在Uber Seattle的meetup的报名连接

最后让我们回到我们的home sweat home---旧金山湾区,3月14日晚,Alluxio项目的no 1 contributor Calvin Jia将和唯品会的架构师Wanchun一起介绍Alluxio 2.0以及Alluxio在唯品会的准实时数据平台上的应用。Alluxio 2.0里有大量的新功能,可以参见我的前一篇博客"关于Alluxio 2.0,你要知道的都在这里了"。而唯品会的这一应用也是非常的前沿:使用Spark/Alluxio/HDFS来架构一个near real-time的购买归因分析。这一应用在众多电商或者相关行业都非常有普遍性。

点击3月14日在湾区San Mateo的meetup的报名连接

你可能感兴趣的:(TwoSigma, Uber Seattle, Alluxio HQ: Alluxio meetup三连)