架构师(2015年9月)

卷首语

作者 七牛云存储CEO 许式伟

这个月七牛刚刚举办了D-Future大会。这是一个以数据为主题的会议。如果要用一个词来概括当前互联网时代的特征,那就是两个字:数据。实际上信息一直都存在,只是它以前存在于原子世界,有了计算机和互联网之后,出现了一个由数据构成的新世界:比特世界。并且这个新的世界正在以每三年翻一倍的速度在膨胀。计算机和互联网扩展了人的逻辑能力,让我们有了很强的分析和预测未来的能力。在这样的数字化洪流下,我们的商业将受到非常巨大的影响。

首先,我们来看一看业务本身。互联网化最基础的一个诉求就是业务上网。我们对比一下传统的商业和新兴的商业形态,最大的一个不同是什么?如果我们用一个词去概括旧的商业形态,我个人想到的一句话是“一手交钱一手交货”,这就是旧的商业形态最基本的特色。但是互联网改变了这一切,它让远程交易成为了可能。互联网时代业务的特征,我也概括了一句话:“非结构化数据是人类最自然的沟通方式”。我们自然表达的语言文本以及图片、音频、视频等媒介,都是非结构化数据。这些数据人类容易理解,但计算机则很难。非结构化数据忠实地传递人的意愿。比如,我拿起电话说几段语音,告诉对方我想要的东西。或者通过图片和视频,表达一个商品长什么样,商品该怎么使用的。我们可以看到,非结构化数据自然而然会成为交互的一个中介。这些非结构化数据是我们实际存在事物的记录,而这也是原子世界被疯狂地映射到比特世界一个根本原因,因为业务要上网。

第二,当业务上网之后,我们的运营会发生质变。在旧的商业过程当中,大部分的企业会找一些样本客户来做调查问卷。但业务上网后,可以天然地记录每一次的交易过程,能把所有用户的行为都记录下来。今天我们不是取样数据,而是全量地记录用户行为。每天我们都在产生上千万上亿的交易记录,而如何通过这些交易记录去改进我们的商业模式,是一个非常重要的课题。

无论是非结构化数据或者记录用户行为的日志,我们都面临很多机遇和挑战。我们先看一看非结构化数据。如前所说,现在数据世界正以每三年翻一番的速度在膨胀,而这其中95%以上都是非结构化数据,而且这个比例还在不断的提升。如此惊人的数据量,应该如何收集,如何保存,如何进行分析和挖掘,这又是一个很重要的课题。非结构化数据今天主要的用途是用来做交互,但是计算机对于语义的理解非常原始,所以在交互的智能化程度上,仍然有非常巨大的提升空间。我们知道有自然语言分析、NLP这样的一些技术,我们还有语音识别,有视频或者图片里面对于场景、对于动作的捕捉与识别等,但是这些都还非常早期。这些技术如果能够往前走一步,就会带来巨大的想象空间。用户每一次沟通,每一次交互过程,都沉淀了大量的信息,但限于我们的分析能力还很原始,所以今天几乎所有的非结构化数据都还没有二次分析。

我们再看记录用户行为的日志。日志是计算机生成的,所以它天然可以很容易被计算机去理解,这个理解是全面的,不会损失什么信息。所以日志本身是一个更高含金量的金矿,但是大部分的企业还没有意识到这一点。另外今天日志的处理能力、分析方法,以及产生对经营有效指导的能力依然存在很多不足。超过半数的企业还没有记录日志,大部分企业对数据的分析仅仅停留在象日活用户、用户留存等基础阶段。绝大部分企业会定期删除日志。

我们刚刚分析了非结构化数据和日志相关的一些挑战,这些挑战绝不是七牛一家公司所能解决的,我们希望有志于去提升数据应用价值的企业,都能够一起共同开拓这个数据世界。我们希望能够分析数据的使用场景,去触及它的方方面面,去构建一个完整的技术栈,构建一个全新的商业形态。

平步云端,数据为先。让我们一起共同发掘数据背后的价值,共同构建新时代的商业文明。

目录

推荐文章

成为一名优秀的Web前端开发者;

Java永久代去哪儿了

专题

Netty案例集锦之多线程篇

Kafka设计解析(四):Kafka Consumer解析

观点

我为什么反对用Node

亚马逊中国可下载本书的Kindle版本。

  免费下载此书 (ePub)   免费下载此书 (MOBI)

你可能感兴趣的:(架构师(2015年9月))