7月22日,在重庆市渝北区政府的大力支持下,希鸥网联合重庆仙桃国际数据谷,以“为创业加速”为主题,在北京歌华开元大酒店举办了第五届中国创新创业领袖峰会暨2017希鸥会社群大会。
星瀚资本创始合伙人杨歌为参会者带来了题为《从互联网到人工智能》的演讲。
以下为杨歌峰会现场演讲实录大家好!很高兴跟大家在这里见面,估计有很多人也知道我们基金。先简单介绍一下我们公司的情况,我们主要关注的方向有两大方向。互联网发展到今天是什么情况,接下来是大数据,然后是人工智能。我们把这些东西叫工具,不叫赛道,这是很多产业需要的工具,这个赛道只是一个阶段性的产物。
我们真正认为有价值的投资是在这方面,就是实力产业的升级,这里面包括很多方向,工业、农业的升级,生命科学、医药、文创,都是我们非常关注的行业。
简单介绍一下自己,自己是一个连续创业者,我在学校做过七次创业,有很多创业经历,后来去做创业导师,由于久病成医后来做了星瀚资本。
讲讲干货。今天讲三个方向:互联网的基础、大数据发展到一定的产物、大数据之后所衍生出的人工智能。
互联网大家都已经非常清楚了,连续改变我们生活将近30年的时间,它重新定义了我们周边非常多的行业,比如说消费升级、智能科技等。它有非常多的形式,共享经济、O2O,这张片子里讲的所有东西。这些都是互联网在过去20年里所产生出来的不同的商业模式。
我们每个人每天的生活都离不开互联网这些所有方向,大家都已经非常熟悉了。互联网的特点是以一个技术的方法颠覆一个传统行业,就是互联网。
我们简单把互联网分成三个方向:
传统互联网。这是社区、门户、及时通信,以基础网页为基础的。从95年开始发展,到2005年,基本发展成熟,特别典型的是新浪、网易、搜狐,包括今天的BAT,以及格局不断变化的BAT,这也是传统互联网的特点。
从10年开始,我们大范围进入到第二个阶段,叫“互联网+”,在“互联网+”阶段里分两个方向,一个是重加,一个是轻加。重加就是加得多,把能放到线上去做的都放到线上,2013、2014、2015年主要是O2O加互联网。
我们发现并不是所有东西都可以O到线上,只是一些刚性需求可以O到线上,因为消费频次比较高。
2016年互联网已经基本结束,于是,我们就做互联网轻加,互联网可以让我们的信息交流更快,产生非常多的数据,管理能力增强、效率变高,我们利用这些技术,以及互联网化传播,自媒体、新媒体的产品,能够迅速的把一个公司的品牌做起来,用TMT去做传统产业的升级。
我们在农业、工业也做了很多的布局。这叫互联网智能化,这是大家现在非常关注,但是现在还没有发展到非常完整的阶段,还有很多机遇、挑战的一个行业。包括大数据、AI这些方向,这也是今天提的主题。第三阶段我们还处在一个摸索阶段,这就是互联网智能化阶段。
我们非常想认清一点,互联网之后我们应该做什么?互联网战场已经被打烂了,我们之后应该做什么?互联网最开始是一个基础的信息工具,不断从信息工具演化成一个生活的方法,变成了管理工具,从管理工具变成标准化的管理工具,于是,变成了一种商业模式。
这种商业模式不断的影响生活、影响交易、影响周边所有东西,变成了一种系统化的东西。在系统化的东西里建立商业模式,不断收集数据,变成产业升级的工具。产业升级之后,数据不断积累,最终让各个行业数据化、智能化。逐渐从技术变成的商业,然后变成了平台。
这里有两道线,第一道线以上的地方是利用互联网的基础能力,两道线之间利用互联网的衍生能力,也就是我们刚才说的TMT。原来有百年老店,现在没有的,互联网手段是用技术手段快速迭代一个公司。
我们投资的新尚本来只是一个线上普通的店,但是他学习到了互联网的精髓之后,马上变成了一家互联网公司。
第二条线以下,在过去5到10年里,我们把所有互联网的商业模式已经迭代完成了,大多数公司都在积累大数据,由于数据的积累,我们对很多行业的认识更加深刻,在这些行业里我们可以用一些算法去计算这些行业,然后去操作一些行业。
2017年之后我们进入到第三阶段,大量产业升级、利用数据,智能化的去处理商业。
这是我们对互联网的认识。我们做过什么?还有什么可做的?互联网作为一个基础的工具,最开始增强信息流动、增加接口、提高效率、产生非常多的迭代,这些方向是互联网在过去20多年做的事情,我们现在在干什么?积累数据,提炼数据价值。在大数据上开始做文章。
这些事情是我们还没有做的,在未来即将要做的,他们所对应的行业有区块链,进一步标准化,在数据里挖掘智能算法,产生更多的能源。现在受制于能源的问题,我们现在的能源还是比较低效的。我们要用新能源,用更先进的办法和生物进行结合,这些是我们在未来20年可以看到、感受到的,当然在硅谷已经快速发展了。
有了互联网硬件,你就可以收集大量的数据。这是大数据的积累,这是算法应用。互联网其实就这三个阶段。
对于互联网基础来讲,已经发展成熟了,对于互联网大数据来说,是半成熟,所以,大数据到现在为止是一个半成熟的阶段。我们有了数据之后,第三步就是利用算法。算法已经有大量的应用,包括机器学习。
但是,在商业领域里还不够成熟,所以,算法级的应用是这几年非常重点的一个方向。给大家推荐一本好书,叫《终极算法》,是比尔盖茨强推的一本书。
对于互联网来讲,推动了人工智能的发展,其实就是这么一个过程,最开始制造了通信和控制接口,可供训练的数据集。我们现在听到了大量AI公司,但是还不见成效,是因为数据不够成熟,对于模型化过程来说,每个行业要见仁见智,还需要大量的时间去训练。
大数据是进入人工智能的门票,是因为大数据是互联网和人工智能之间的衔接点。
对于大数据来讲,我有一个简单的拓扑结构。大数据是不断的收集定义、整理、分析、挖掘、抽象的这么一个过程,把数据不断进行迭代。
你想拥有数据,必须要有入口端,必须有要数据化来源,数据化来源可能是各种各样的东西,有可能是平台、有可能是电商、有可能是你只能化的手环、手表、有可能是硬件,有可能是GPS、有可能是定位系统。有了数据之后才可以进行迭代。
有了数据之后进行计算,计算出相关性,这是大数据的最基础。人工智能、机器学习最重要的也是通过数据去算之间的相关性。算出相关性之后,形成事件画像。比如说,有一个711的小店,小店店主发现下雨的时候,除了雨伞卖的好之外,蛋挞总是卖得好,他也不知道为什么,于是通过相关性,把蛋挞和雨伞结合在一起,结果发现蛋挞卖的更好,这就是基础的相关性应用。
他们之间可能存在一些内在逻辑,但是非常复杂,没有办法直接分析它。形成画像之后要形成反馈。
前两天有一个非常多应用的大数据画像,就是利用行车驾驶记录仪记录每个司机开车的用户习惯,通过用户习惯反过来修改他的保费。打方向盘猛的人可能容易撞车。最后,保险公司发现,动作敏捷的人不容易撞车,而是打方向盘非常慢的人容易撞车。举的这个例子是什么意思?通过大数据的结果还可以反过来再影响它的商业模式,不断通过数据分析和商业模式迭代这件事,这就叫反深性(音)。
我把它模块化,其实就是入口、算法、出口。这里面有很多的应用,比如说每天都会上携程、饿了么,各种各样的平台,我们被记录吃饭、被记录出行、被记录住宿的各种各样数据,于是这些平台就有了一个人物画像。当这些平台综合起数据的时候,就会你非常了解,甚至于比你周围的人还要了解你,这就形成了用户画像,形成画像之后会直接导出。
美国有一家他非特,有一个16岁的女孩,在她父亲知道她怀孕之前提示了她的父亲,因为这个女孩太年轻,不敢跟家里说,在网上一直在搜,搜完之后积累了非常多的数据,这家公司就开始通知她的家里说她怀孕了。还有有很多数据应用,今天不一一讲了,阿尔法狗就是一个非常典型的大数据应用。
另外值得一提的是机器人,机器人实际上从19世纪中,摩登时代的时候,就有很多人在想象未来的机器人是什么样子,一直没有做起来是什么原因?机器人总重要的不是机械,而是大脑、芯片。
芯片这个东西到1960年前后才逐渐发展起来,如果机器人没有大脑,他就不是机器人,只是一堆废铁。机器人要通过运动学的积累训练它的数据积累,然后产生最终的机器人。机器人到现在为止还有被训练的基础。
最典型的一家公司就是美国的波士顿动力,这是专门训练机器人运动系统的。
大数据在发展的时候存在着非常多的问题:
1、为了数据而收集数据
有一家公司拥有40亿某方向的数据,他仍然要融资大几千万去购买数据,他说我这些钱就是用来买数据的,从40亿数据变成50亿数据,我们进行调查发现,其实增加的这10亿数据对他来讲基本上没有意义。
我在调查他所有数据分类的时候,发现互联网、广告数据占到90%以上,其他的数据是非常零星的。数据由于太过于集中,多余的数据并不能给他提供很多的帮助。很多公司在收集数据的过程中非常盲从,这种竞争是非常没有必要的。
2、数据噪音太大,有效数据太小
这是大部分大数据公司所面临的问题,收集了好多数据,真正能提炼出来的价值非常小。最典型的是医疗行业,真正有效的数据并不是在历史上收集的病例数据。
3、数据密集而孤立
饿了么有很多咱们吃饭的数据,滴滴有很多交通的数据,但是它们没有交叉,所以,没有产生更深一步的智能。
我经常举的例子是什么?找一个男女朋友,你刚刚认识他,第一天你知道他想吃饭,喜欢吃西餐、牛排,两个月之后,你知道牛排要几分熟,浇什么汁,之后还要知道有什么配菜,你能跟他在一起吗?不可能,你从一个方面去了解他是非常没有必要的,你必须从全方位去了解,你要了解多元化的数据。到今天为止,很多公司的一个非常大的问题是数据非常孤立,大家没有进行数据的交叉。
4、大数据公司经常想解决一些复杂问题,而不是从简单问题入手。
最开始我们是收集数据,第二步标签化,第三步叫交互、耦合,把更多公司的数据穿插在一起,全面的了解一个事情、一个人。最后一步,形成一个精炼的数据集。我把这个过程比喻成什么?比如成买菜、择菜、洗菜、拌菜、烩菜。
在大数据之后,我们用了很多数据之后,我们就开始做人工智能。大家不知道人工智能和机器学习是干嘛的?把人工智能模型化过程分三个方向,告诉计算机、赋于计算机智能,这改变Y=F(x),在过往里,写一个函数是非常复杂的,现在不用了,现在可以自学习,阿尔法的程序非常简单,几百行到几千行。再就是随机误差,这个不讲了。
讲一个关于机器人的,赋予的智能,相当于是我们写好的程序,我们让这个机器人干一件事情,以后机器人是这样的,它有各种各样的APP,你放一个APP在这里,他就会帮你做菜。
第二个是学习出来的智能,你给他一个任务,你的任务是帮我谈判,以最低的估值把这家公司谈下来,他就开始学习,收集各种各样的数据。在纽约有一家公司真的在用算法进行谈判,两家公司在谈判之前收集他们所有的数据,然后这个计算机就开始算,算出一个最优的结果。越来越智能之后会变得感性。
我们知道能写出来的东西告诉计算机,这叫弱智能,在过去6、70年代里我们一直处于弱智能阶段,第二阶段是强智能。计算机可以学各种各样的语言,同时可以告诉你很多附加产品,大家是习惯用左边写字,还是用右边写字,大家习惯用什么颜色的纸去写做。
最后是超智能,实际上是一个综合化的智能,这里不得不提的是智能驾驶,大家都觉得智能驾驶要来了,但是难度有多大?对于美国来讲,它的交通问题和智能驾驶是强智能的问题,因为它的交通比较规范,很多交通规则大家都非常遵守。这个车停下来,那个车停下来,这个车走那个再走。
在中国交通是极其复杂的事情,有碰瓷的,有外卖小哥拍你。中国的交通规则非常混乱,而且中国还要保护弱势群体,人和自行车是要保护的,没有原理,你必须保护。要在中国想实现智能驾驶它叫超智能,要分析的东西太多。有一个碰瓷的人,如果你的分辨率不好,你直接就看不到他。
有一个荷兰的交通学家,说我用一年解决你们的交通问题,后来待了三年走了,说中国没有交通问题,只有社会问题。在中国要想实现智能驾驶,车必须具备人的智商。我们要想利用算法必须区别出是强智能还是超智能的差别。超智能是一个复杂场景,是一个非常复杂的场景。强智能在很多方向都可以做,比如说量化金融,物流仓储的数据优化,这些都可以用大数据和人工智能。这件事情我们一定要区分开。我在网上写了很多的文章,大家有机会也可以看一下。
对于人工智能,机器学习的基础就是网络。我要讲的并不是它的原理,我讲的是它的发展速度非常快。12年之前,无人问津,这个东西已经20多年历史了,包括我在大学,在清华做算法分析的时候,都用过神经网络,说实话,不是太懂。
这件事情在12年之后迅速发展,马上迭代出各种各样的网络。我发现一个非常可怕的问题,这个东西就像电路板一样,刚才讲的还是一些具体的数学,在这两年发展中,每一个神经网络变成了一个基础原器件。这个原器件越变越小,越变越密。
咱们在初中的时候都上过电工课,收音机里有一个晶体管,摩尔定律发展到现在这里面有几百万个、几千万个晶体管在里面,人工智能这件事跟晶体管很像,发展之快,让我们无法想象。
这是今年刚刚出来的,反馈性神经网络在前两年还很简单,去年的时候已经极其复杂,大家拿人工智能的原器件就像是一个小玩具一样,变得非常细。谷歌、亚马逊这种公司是非常疯狂的在训练这个东西。人工智能的特点是什么?发展速度非常快。
对于这个行业来讲,有时间就要学习。
对于人工智能的应用我做了一个总结,分三个方向。
1、AI是工具
最重要的两点,你要想利用人工智能、AI必须有两个基础条件,要有大量数据,没有数据你就没有办法迭代,你手上的东西只是一些干的知识。推荐大家一本书叫《大数据时代》,里面就讲了这个过程。
要有精准的模型化能力,这是未来10年对CEO的重大调整,CEO可以不会写代码,但是CEO一定要有理解算法、利用模型的能力,否则你就会被迭代。
我们跟鹰总还投了一个餐饮的公司,他说现在餐饮只是一个系统化的工程,如果你只会开店这家公司是坚持不下去的,一定要有云、有算法、有数据。
2、这点非常重要,AI应用于什么方向?不好应用在复杂系统里,易于应用在精密系统。
什么是复杂系统?智能驾驶是复杂系统,要考虑每个人的人性,并且把人性数据化、量化,这是一个非常困难的过程。很多数据的底层是不好进行数据化、量化的,你怎么评价一个外卖小哥这时候到底是想加塞,还是等一下。
真正的大数据和人工智能应该应用的方向是什么?是精密系统,这个行业本身就有非常标准的数据基础。金融行业就非常典型,一个月之前有一篇报导说最重要的大数据分三个方向,一个叫由个人在网络上产生的数据,没填写的博客和产生的视频,这些叫精密系统数据。
第二个是交易数据,我们每天买饭、打车这些所产生的金融数据是实实在在的,是能训练出很多智能的。第三个来自于各种各样的传感器,这种数据是我们每天运动、生活的基础,这些数据也非常精准。
最后一点,听起来比较拗口,叫强耦合。互联网是拿来主义,这个行业只要有人做成功了,我把这个模式放在我这个行业就可以了,但是AI行业绝对不是,AI行业是每个行业都有自己真正的AI,必须要由这个行业自身的专业人士进行迭代,把他的思路和计算机进行交互,把他的思路迭代成一种算法。
对于AI来讲,大家眼中所看到的智能是什么?都是这类东西(见PPT)。量化金融,这是我们现在自己已经开始孵化的公司,物流、仓储、农业、消费、医疗,这些有结构化数据的行业非常适用用AI。
最后,讲讲关于未来的理解,这个讲得比较白话文。我跟美国一个人经常聊天,他跟我讲了一个例子,今年60岁了,他在一九七几年的时候,小学同学、中学同学,家庭条件好的都去干飞行汽车了,他们完全不能想象,3、40年之后每个人抱着手机天天点赞,上个礼拜已经可以通过卡体基因治疗癌症了。
很多对未来的理解都是由当下自己的想象,线性的发展去认知,真正的未来是完全不一样的。现在手机的恶性竞争,手机屏变大,变得再大,这些其实并不是未来的发展方向,只是一个阶段性的商业竞争产物。
每一个技术在发展过程中都有一个兴衰的过程,就像这张图一样,技术是推动产业发展的,但是,最后要离开这个产业变成一个工具。
互联网最开始是一个技术,然后变成了一个摸索商业的过程。2001年到2005年是摸索成长期,05到10年典型互联网上升的红利期,这里面出现了大众点评、携程、去哪儿。只要你好好模仿美国的企业,把这些商业模式带过来就可以很方便的融资,在当时的情况。那个时候是上升红利期。当大家都看懂的时候就进入到产业升级期,也就是2010年到2015年,产业升级和应用爆发的过程,大家把什么东西都互联网。
2015年之后进入到增长泡沫期,有很多东西不适合做互联网化的,都去做互联网。到今天为止,互联网已经变成了一个纯粹的工具,和法务、财务都一样,每个公司都必须要有懂技术,能做网站,有互联网思维的人。它历经了这么一个起承转合的过程。
对于互联网来讲,它花了30年的时间在市场上进行发展,到今天为止,可以说已经告一段落,如果在今天还再继续逗留,你会承担同质化竞争非常高的风险。
一个技术循环完之后,你要做两件事,第一件事逗留在原来的技术里承担高风险,博取一些差异化竞争的收益。或者是走到下一个循环前面,做生物质能、生物医药。
在今天有一个特别有意思的点,互联网这个战场已经打完了,我们处在这个阶段,但是又有很多新的东西出来,我们不敢碰,这个时候就产生了一个博弈,你到底站在哪一边,觉得站在哪一边都可以,都有可能做起来,但是你要知道两边的风险是不一样的。
在技术和产业发展的过程中,永远都是交互迭代的,这个技术下去的,下一个技术就起来了。计算机这一轮下去的,手机这一轮就起来了,互联网这一轮下去的,大数据和人工智能就起来了。我们现在在今天正好处在一个交叉点上。
2016年为什么陷入资本寒冬?就是因为有很多东西已经被我们玩爆了。
最开始是工具,后来变成机械,主要由19世纪来开发,19世纪下半叶开始开发机电,1950年发明图灵计算机之后于是就进入到归集电一体化。这两年发展非常快的是碳,和生物进行结合。很多硅谷公司都在做脑机结合,和生物结合。作为一个人来讲,人50瓦,这一个灯几百瓦。说明人的效率非常高。
每一个阶段的变化都是降低成本、降低能耗的过程。飞行汽车这种东西,是一个伪命题,为什么?不降低成本、不降低能耗。飞行汽车是什么?就是私人飞机,是服务于极少数人群高成本、高能耗的产品。苹果手机之所以可以量产,是因为所有原器件的成本降到足够低了,所以才爆发起来,趋势是什么?要更加智能、高效。
如果大家有机会的话,可以跟我在线下多探讨。
本文为杨歌在希鸥网第五届创业领袖峰会演讲内容,转载请注明来源。希鸥网是国内领先的创业社交社群媒体,平台拥有15万创业者会员和千位投资人。