大数据背后的真正意义

大数据背后的真正意义

《元宇宙:数字文明》第二章节选


没有数据的网络是空洞的,没有进行技术处理的数据是无用的,基于数据孤岛的大数据分析缺乏实际意义,也很难形成具有参考价值的样本,在所有智能手机中标配的智能助理,例如苹果的Siri等等,他们是否会变得智能取决人机交互频率,深度,这些非常依赖大数据资源。没有足够多的用户样本,这些所谓的“智能”没有任何实际价值。

中美两国之所以能在人工智能,机器学习领域领先全球,根本在于中美两国拥有较大规模的在线数据样本。而中国则具有后发优势,目前在逐渐呈现出追超的趋势,如图2.7、2.8所示:


图2.7  深度学习领域中美之间的竞争对比


图2.8  人工智能领域论文引用对比图

中国之所以能够形成后超的趋势,在于中国在数据开放度方面一直遥遥领先于美国,而在政策层面,中国政府更早就开始密集制定一系列指导发展的政策与行业准则文件,为新技术发展奠定坚实的基础,如图2.9,2.10所示。

图2.9  中美两国数据开发度对比

图2.10 中国政府颁发的相关政策与规划

较大规模的数据样本,为网络发展尤其是初阶阶段提供了验证,完善,成熟的场景。这就是为什么数字化时代里,已经形成规模效应的国家与地区在未来的竞争中将继续扩大这种优势,与传统经济模式发展不同,数字化时代里,后发者优势的可能性将很难存在。新兴技术的发展,非常依赖规模性数据的支持。

近期,国家五部分要求治理算法推荐,算法真正出名是因为字节跳动这家独角兽公司,从2012年注册成立,到最近一次(2020年3月20日)的估值已经接近千亿美元这个门槛,手里握着抖音这张短视频时代的王牌。

谷歌前CEO曾说这样一句:现在是数据的时代,算法的时代。汇总起来说算法与数据构建了智能技术发展的基础条件。

可能是时代的巧合,中西方之间,西方发达国家首先进行的是产业数字化,而国内是先从人联网开始的,相同的是都实现大规模的数据收集,这样的话题一直在网络上被讨论,大家都在思考这两种进程对各自带来的优势,当然美国有点特殊,他也首先进入人联网发展阶段,但是活跃度被后来者中国追赶上,但是两者的区别在哪里呢?

(1)技术的滞后性,让中国的人联网所完成大数据收集更具即时性与实效意义。这句话可以用之前全球分工协作的场景来诠释,发达国家先完成工业化,但是作为后发优势的国家中国,通过消化西方发达国家的技术,并再完成升级,并及时搭上了信息化的发展规划,因为作为后发优势的国家,一切基础设施都可以重新构建与设计,一切设备都可以是新的,也就是意味着中国可以使用更新的设备再用最少的成本完成赛道的变轨,而西方国家则无法复制这个过程。大数据这个概念很早,但是我在书中所说的那样:数据只是收集是没有意义的,或者说是没有完全释放出数据背后真正的价值,对应的无论是算法,人工智能技术都是近期来逐步发展起来,更高性能的算力设备也是最近几年发展起来的,对应的中国人联网阶段完成大数据就可以及时搭上这个及时雨,这就是为什么中国在大数据,算法,人工智能领域的研究能够跟得上世界前沿甚至部分已经成为领头羊的背后原因;

(2)产业数字化先发优势,确实能够享受到后进国家的市场需求带来的市场红利,但是进入数字化时代,基于多种技术场景组合,中国完成的人联网场景可能让中国头部的互联网科技公司完成资金、人才、技术的沉淀,而且这个结果更具时代性,也更具实效性,这就为什么以算法技术著称的字节跳动公司能够研发出在海外火热的应用:TikTok,颠覆了在全球应用市场中中国公司弱势的竞争领域,实现了超越。

所以,历史既有某种必然性,当然也存在偶然性。同时,需要用发展的眼光看待当下发生的时间,任何领域都是如此。

从发展的角度看,中国所完成的网络生态更具效率,规模也将最大,可能会下一阶段实现整体超越,这个时间点可能已经不远了,千万不能再用传统的视角看待产业的发展。

01 数字产业的基础原料:

19年,世界上最大的社交平台Facebook联合多家大型机构发起数字货币联盟Libra(天秤座)发布白皮书,披露数字货币Libra币的相关信息,并宣布尽快上线。这一消息同时引起了白宫,美财政部,美联储等重要的政府机构的强烈发对,最终被美国众议院叫停。

事实上,同时还有其他美国私营企业已经或者已经在规划发布数字货币项目,但是为什么是Facebook在全球范围内引发了这么大的影响?反对Facebook的不仅仅美国政府,还有德英法三国政府。截止20年,Facebook全球活跃用户超30亿,而截至21年全球人口达到78亿,意味着如果Facebook发行数字货币成行,可影响接近全球一半人口,这是非常令人震感的。

“一旦我们把我们的感官和神经网络系统交给那些试图从租借我们的眼睛、耳朵和神经中获利的人操纵,我们就真的没有任何权利了。把我们的眼睛、耳朵和神经出租给商业利益就像把普通的演讲交给了一家私人公司,或者像把地球的大气层交给一家垄断公司。”—马歇尔·麦克卢汉《理解媒介》

从Facebook这个案例中,我们也可以看出拥有海量数据的平台,再结合大数据技术,在互联网发展逐步进行智能化的进程中,将体现出超乎大众设想之外的影响力。

“数字经济是以数字化的知识和信息作为关键生产要素,以数字技术为核心驱动力量,以现代信息网络为重要载体,通过数字技术与实体经济深度融合,不断提高经济社会的数字化,网络化,智能化水平,加速重构经济发展与治理模式的新型经济形态。(数字经济的四化框架如图2.11所示)”。——《全球数字经济白皮书》,由中国信息通信研究院发布

图2.11  数字经济的“四化框架”

很多人都熟悉贪吃蛇这款游戏,该游戏通过控制蛇头方向吃蛋,从而使得蛇变的越来越长,最终我们视野中的屏幕中只剩下一条长长的蛇,蛇身中即变成它所处的空间中的虚拟环境,如2.12所示:

图2.12  贪吃蛇游戏

我们目前正在谈论,思考,应用的数字化场景也有点类似。以四化框架中的结构,每个模块都已经实现了有限的布局与落地场景,目前只缺一条类似“贪吃蛇”的场景与技术来实现整体的协同,或者说容纳这些,实现在同一场景里的自发式、协同工作或者创作。

“为此,阿里巴巴专门成立了一个团队—数据中台。这个团队从事的是一项异常辛苦的工作,就是进入每个业务部门去做沟通,然后把它们的数据定义,计算,存储全部标准化之后,放到一个统一的平台上。这样一来,将来任何部门需要对数据进行调用,都会有一个统一的数据库,而且在使用数据的过程中,所有的变化都会被平台追踪,这样将来它们所取得的任何有附加值的服务,别的团队都能共享。”—《智能商业》

事实上,无论是互联网企业还是高端制造企业,都在构建属于自己的数据中台,例如华为,OPPO,网易,滴滴等,而阿里云,腾讯与等云计算服务商均针对各行各业提供对应的解决方案,如图2.13所示。

图2.13  阿里云的数字工厂解决方案

02:平行于现实世界中的数字自我 

AYAYI9月8日正式成为阿里的数字员工,更早她在小红书平台发的第一条内容就获得了224万阅读,更多人都将AYAYI当成了和我们一样的现实中活生生的人,实际上AYAYI是中国首个Metahuman(超写实数字人),如图2.14,2.15,2.16所示:

图2.14  中国首个超写实数字人:AYAYI

图2.15  AYAYI正式入职阿里,成为数字员工

图2.16  AYAYI的社交账号

2021年,超现实数字人这个完全新生的事物,像是雨后春笋一样的涌现在我们视野之中,进入我们的日常。全球首位数字宇航员,新华社数字记者小诤9月17日首次亮相,小诤由腾讯旗下NExTStudios提供技术支持实现的。

    NExTStudios工作室,大家都很陌生,她隶属于腾讯体系,是最年轻的工作室,研发的范围除了游戏之外,还有高保真数字人与AI技术等等,如图2.17所示:

图2.17 NExTStudios官网介绍

超现实数字人领域,最出名还是由Epic所展现的基于虚幻引擎驱动的MetaHuman Creator(MHC),阿里的超现实数字人就是MetaHuman产品,也俗称捏脸技术,大家在看数字人AYAYI时最大的感受是什么?是不是非常像真人,这就是超现实数字人给我们带来的震撼,而现在几乎所有人都可以通过Epic官网申请下载相关工具创造自己的数字人,如图2.18,2.19所示:

图2.18 Epic官网关于MetaHuman的介绍

图2.18 Epic官网关于MetaHuman创作申请页面

大约从20世纪80年代开始,许多技术专家就在猜测互联网的“接班人”。这个概念在一段时间里戴着其他面具,威廉·吉布森(赛博朋克运动之父,科幻文学的创派宗师)在《神经漫游者》(1984年)中首次将其称为“赛博空间Cyberspace”—计算机网络中的一种大众共识幻觉,这后来称为他的名著《神经漫游者》,如图2.15所示的核心主题。从那以后,赛博空间在日常使用中退化为互联网。这个概念的内涵,逐步被Metaverse(元宇宙)所替代。

图2.19  《神经漫游者》封面形象

事实上,根据我们已经在网络空间中形成为大数据,完全可以基于最先进的技术创造另一个数字自我,这些技术场景,无论是对个体本身还是人类社会未来,都将产生巨大的影响,当然也将会对信仰,生活方式,政治,文化等一切产生颠覆性的影响,整个人类社会可能还没有做好应对的准备。

2020年5月,新华社联合搜狗公司推出了全球首位3D虚拟主播:新小微,实现了零出错,全天候在线等场景,如图2.20所示。

图2.20 虚拟主播

近十年来最负盛名的游戏制作团队之一的Epic Games发布了基于虚幻引擎驱动的MetaHuman Creator(简称MHC),已经实现可以更轻松的方式来制作高保真的数字人这一畅想。

当数字自我成为平行于现实世界中的另一个身份时,虚拟空间对于个体而言就不再是可有可无的存在。而当我们不断关注,甚至介入时,我们的行为数据又将无意中进一步完善了数字自我的内在,并让他成为非常具体的,且可能进化成数字生命体。

你可能感兴趣的:(大数据背后的真正意义)