社会化数据的混合存储和高效处理

概要
多源异构的社会化数据,往往拥有复杂的Schema结构化数据和多样的非结构化数据,并且拥有过百亿的数据规模;如何合理的整合和高效的存储这些数据,以便解决实际的业务应用问题,包括查询、检索、关联、可视化、数据挖掘等应用问题;面对热门的开源组件和体系结构,如:Hadoop、Hbase、Impala、Titan、Elastic Search等,我们该如何选择并优化存储结构来解决实际应用困惑?此外,大数据治理的痛点、选择存储架构的要点、流行开源组件的对比也是本主题演讲的重点。

个人简介

任鑫琦,明略大数据关联分析产品SCOPA负责人,2009年毕业于北京大学,先后在百度、斯伦贝谢担任研发工作,后加入秒针负责大数据计算和平台管理;2014年正式加入明略,先后负责了NoahArk、LogM等多款产品研发,目前任大数据关联分析产品SCOPA负责人。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、上海、旧金山召开。自2007年3月份首次举办以来,已经有超万名高级技术人员参加过QCon大会。QCon内容源于实践并面向社区,演讲嘉宾依据热点话题,面向5年以上的技术团队负责人、架构师、工程总监、高级开发人员分享技术创新和最佳实践。

你可能感兴趣的:(社会化数据的混合存储和高效处理)