非常幸运的抓住了一次参加2013年大数据技术大会和学术大会的机会。除了技术之外,在经验和阅历上确实对个人提升起到了很大的作用。不得不说,作为一个学生来讲,能够参加这样的大会还是非常受益的。留点文字记忆,以后可能再回顾一下。
第一个感觉:搞大数据的人越来越多,而且是年轻人为主。这里所谓的年轻人就是30岁上下。可见,IT的确是口青春饭。
技术大会在12月5日举行。世纪金源大酒店的大厅本来是东西两个厅,由于注册人数比较多,事先就把两个厅合成了一个厅。但是参会的人数实在太多了。以至于两侧都站满了人。似乎能达到2000多人。CSDN官方应该有数据。从说话行为和着装上来看,技术圈子的人占了绝对主力。各个企业的工程师们都想在这里看看其他公司是怎么搞大数据的。百度、阿里、腾讯、360等当之无愧成了主角。
第二天的分会场里,第九会议室的大数据技术分会场几乎成了热捧的对象。小小的会议室,热的难受,但是依然人满为患。我也只好坐在讲台前的地面上了,幸亏是地毯。感觉坐着椅子上的人,还不如站着的人和坐在地上的人多。可见大家的学习热情。
另外一个特点,可想而知,大数据平台架构与系统分会场的老外的讲座明显比国内的更有吸引力。不过糟糕的是,现场的同传实在不给力,很多词汇是ChinGlish。或者干脆‘额~~~’,跳过了。
第二感觉:学术会议的人数相对较少,但是也超出了预期。
学术大会在12月7号举行。由于在国家会议中心举行,正赶上孔子学院大会、APEC、婚庆大会之类的。所以现场没有被批准放置太多的宣传。 所以显得有点冷落。
但是从参会人数来讲,400人的报告厅,也挤满了。有的干脆坐在走廊上。学术会议的报告,多少有些老生常谈。
不过还是有亮点的。徐宗本院士的报告引起了现场广泛的共鸣(回来特地搜索了一下徐院士的履历,的确不简单啊,很有故事的人,也很励志,敬佩之情油然而生)。题目是《关于大数据研究的若干科学问题及其初步探索》,徐老师结合自己的研究体会,从数学的角度,冷静客观的分析了目前大数据研究的若干问题。他的一句话很朴实,也很有意义,大概意思是:研究大数据,不可太热,不能盲目的一哄而上,一哄而上之后,往往是一哄而散,这是最可怕的,也是常常发生的事情。徐老师提出了目前大数据研究的几个基本问题:
1.高纬问题——稀疏建模理论
2.重采样问题——分割大数据为小数据
3.计算理论问题——计算复杂性
4.分布实时计算问题——问题的可分解性和解的可组装性。随机优化的计算模式,而不是传统的方程组求解模式。
5.非结构化数据——与人的认识不一样,不仅涉及技术,而且还涉及到心理,哲学等等
6.可视化分析——心理学、美学、数学、工艺设计等等
第三个特点:HADOOP和mapreduce独霸大数据天下的局面已经不再,目前多种计算框架日益成熟,应用场景也越来越多。这里边最主要的就是是基于YARN的堆栈的发展。