1.社交网络的规模超出了任何理性预期
Facebook(FB)的官方统计数据表明,FB拥有每月移动活跃用户13.2亿和10.7亿。 大约81.7%在美国和加拿大以外。 FB管理着总计24亿用户,其中包括拥有7,185名员工的移动用户。
联合国估计,截至2014年7月1日,世界人口为 72.43亿。 因此,全世界33%的人口居住在FB上。 这包括每个活着的婴儿和人,如果他们不识字,则进行抽象。
Google 报告每月有5.4亿用户,每周上传15亿张照片。 加上Twitter,Quora,Yahoo等,我们的人数达到30亿,此外还有写电子邮件,聊天,发推文,写问题答案和提问,看书,看电影和看电视的人。
现在我们有了事实上可测量的集体无意识的这个词,准备进行分析。 它包含我们内心某些未知的信息。 这个相当奢侈的想法来自大约70年前的Carl Jung 。 我们应该认真对待他,因为他的教义促成了迈耶·布里格斯 ( Meyer Briggs)的发展以及无数的其他性格和职业测验,这些测验被证明非常准确。
社交媒体生活支持的利润取决于有意义的信息。 FB报告称,2014年第二季度的收入为29.10亿美元,而只有2.3亿美元来自用户付款或收费。 在所有收入中,有77%是通过广告和其他相关服务货币化的已处理信息。
传统大数据( 仅有的数据就是大数据 )的工具已不再足够。 几年前,我们在1亿用户范围内进行讨论,而现在,数据集的大小为EB和Zettabyte 。
1 EB = 1000 ^ 6字节= 10 ^ 18字节= 1000000000000000000 B = 1000 PB = 1百万TB = 10亿千兆字节
1 ZB = 1,000 EB
我从发布的信息中整理了这张图表。 它显示了多年来(假设进行了最佳压缩)世界存储容量的增长。 2015年数据是从思科推算得出的,容量超过了1 ZB。
2.高吞吐量和高性能计算的突破。
就分析的数据大小而言,成功搜索希格斯粒子的工作超出了一切:
在ATLAS检测器上从日内瓦CERN的大型强子对撞机(LHC)收集的数据量描述如下:
如果将记录来自ATLAS的所有数据,则每秒将填充100,000张CD。 这将每秒产生450英尺高的CD叠堆,每年将到达月球并两次返回。 数据速率也相当于同时进行500亿次电话通话。 ATLAS实际上仅记录了一部分数据(那些可能显示出新物理学迹象的数据),并且该速率相当于每分钟27张CD。
花了20年时间和6,000名科学家。 他们创建了一个网格,该网格具有200 PB的磁盘容量和300,000个内核,其中150个计算中心中的大多数通过10 Gbps链路连接。
动态数据中心概念这一新想法尚未成为主流,但如果能够实现,那将是一个很好的主意。
在另一个博客条目中描述了此概念。 想象一下,这个世界上的每台计算机和笔记本电脑在不使用时都插入了全球云中,并且像存储USB卡一样容易地取出了。 头脑令人困惑,但这将是一天的现实。
3. HPC初创公司在加利福尼亚州旧金山的爆炸式增长
新一代的性能计算物理学家感受到了超级计算对社交网络的亲和力。 所有人大约30岁了,您可以参加其中的一些会议 。 许多人来自斯坦福大学和伯克利大学,之前曾在开放科学网格(OSG)或费米实验室工作,但后来定居在西海岸。 其他人是才华横溢的俄罗斯人,与Google的谢尔盖·布林(Sergei Brin)一样。 他们现在快乐地是美国人。 来自中国和印度的一些非凡面Kong。
旧金山是个疯狂的地方。 实际上,对我而言,旧金山的一切都“正常”。 HPC需要一个这样的城市,以振兴HPC思想家,并摆脱那种花巨资购买庞大基础设施(类似于罗马尼亚的Ceausescu宫殿)的思想 。 独裁者拆除了大约19座教堂,6个犹太教堂和30,000所房屋。 没有人知道该怎么办。 难题是使其成为购物中心或罗马尼亚议会。 传统的HPC也有类似的故事,例如Waxahacie
观看我在这段视频中关于用户体验的评论。 95%的科学家无法获得超级通勤奇迹。 我说我们必须使每个科学家都可以使用高性能计算。 在最终的化身中,任何科学家都可以在较小尺寸的数据上进行类似希格斯事件的搜索,并且大多数时候都可以成功。
参见例如PiCloud 。 清楚地了解它是如何工作的 。 全部用Python编写。 清楚地知道它要花多少钱 。 他们仍然对学术界和HPC拥有认真的解决方案。
为了进行比较,请查看HTCondor文档,请参阅安装或尝试学习名为dagman的内容 。 只需添加一项功能,没人会关注使其易于学习和使用。
我曾与HTCondor工程师一起工作,可以说,这是我见过的最好的。 他们需要以一致的方式接触旧金山。
4.社交网络巨头可以使用HR获得HPC HTC能力吗?
不,他们不能。 通过HR招聘的个人HPC员工不会创造新的文化。 他们将模仿群体内部的主导思想,并失去原始的身份和创造力。 正如Drop-box明智地发现的那样,秘诀就是收购并与一家初创公司建立内部核心竞争力,该初创公司提供他们还没有的东西。
5.使HPC / HTC启动成功的策略。
是的,拥有100万用户作为PiCloud很难。 实际上,这是不可能的。
但是,PiCloud技术确实可以通过使用HPC / HTC在已有1亿用户及更多用户的社交公司中通过黄金发现来交付数亿美元。
我们吸取的教训是:HPC / HTC无法模仿社交媒体业务模式,该模式累积了数百万(千万别介意数十亿)用户。
成功不是由功能构成的。 成功是关于使某人快乐。 你必须认识那个人。 社交网络是使人们易于使用他们提供的一切的专家。
HPC / HTC应该使社交媒体公司感到高兴。 只有通过这种共生的HPC / HTC(一方面),以及社交媒体加上Predictive Analytics(分析),另一方面,高性能计算才能在财务上取得成功,成为最低可行产品(MVP)。
翻译自: https://www.javacodegeeks.com/2014/09/five-reasons-why-high-performance-computing-hpc-startups-will-explode-in-2015.html