我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词

我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词_第1张图片

编译 | IT桔子 原野



回顾我的职场生涯,我认为自己是非常幸运的,能够赶得上人工智能这一波科技浪潮。之前,我一直从事着「推荐算法」的研发工作,后来一家「金融科技」(FinTech)聊天机器人平台找到了我;最后,我进入到了硅谷最知名,或者说世界顶级创业孵化器 Y Combinator,为 Bicycle AI 初创公司工作。

在这家公司,我们希望通过将「人工智能」和「人」相结合,给客户提供更加优秀的人工智能服务。

这几个月在 Y Combinator 孵化器里的所见所闻让我受益匪浅,我在 AI 和聊天机器人领域上学到了很多东西。湾区真的是一个很神奇的地方,聚集了一大票非常优秀的人才,他们会倾囊相授。而接下来,我会跟大家分享一下在一家人工智能初创公司里得到的收获。噢对了,顺便补充一下我的背景,我还学过心理学。


1. 如果不是 AI,那么请别叫它 AI。

所以到底什么才是 AI 呢?其实就连我们公司内部的人都连这个基本的概念都无法达成共识。我经常听到人们用这样一句话定义 AI:


「AI 是一种机器能够模仿人类智能行为的能力。」


如果我们要以这句定义作为参考就会出很多问题。就说现在医院通过某些科学技术,能够在人的肺部提前发现潜在的,具有癌变可能的细胞,这应该不是在模仿人类的智能行为吧?

再比如,理解客户的问题,再通过超大海量的数据中提取出来准确的答案,这种 AI 同样不是在模仿人类智能行为啊?事实上,它的能力完全超脱出了人脑力的范畴,这符合上面的定义吗?

尽管我们现在离「人工衍生智能(AGI)」以及「技术奇点」还很远,但我们现在利用 AI 所能做到的事,却已经让我们自己都吃惊不已了。

不可否认,现在「人工智能」已经成为了科技界最为时髦的词汇。在今年召开的 CES 大会上,我们可以看到 AI 这个词出现在各种你所能想象得到的电子设备上,从牙刷到洗衣机无所不包。但是,请不要这么滥用 AI 概念。

如果你是一名投资人,或者是一名想要引入人工智能技术的创业者,除了要把那些戴着 AI 帽子的冒牌货剔除出视野之外,我也不推荐你去使用那种面向大众,一个解决方案匹配无数应用情景的服务,就比如说第三方算法(NLP 引擎),云平台上的 API。

你要去寻找某些开源的,具有替代性质的解决方案,将它们加以变通,测试,使得它们能够更加精准满足你自身的用户使用诉求。


为什么我认为对于创业者来说,目前市面上现成的解决方案并不是理想的选择?

首先第一点:它们那种「以一对多」的特点,决定了它们的短板。一个基于你自身的诉求而加以改良,具有专属意味的技术解决方案,其带来的效果将远远胜过它们。来说说我们自身的例子吧。

我们一开始是用 IBM 的 Watson 作为技术平台,但是很快就转而去开发我们自己的解决方案,我们不停地去测试它们,一旦发现效果比之前的理想,立刻就转面转投到这个方向上。市面上现有的解决方案很多都是免费的,或者是处在充分竞争市场中,价格特别得低,这固然挺吸引人的,但是你要知道它们想要的是什么,它们想要的是数据,你的数据。我想说的是,一开始你使用第三方服务,这没什么,但是要很快地去开发自己的技术来将其取而代之。如果你的团队没有这个研发实力,那么就聘请有这方面实力的技术人才,而且动作要快!


另外,如果你现在就想在 AI 领域开创属于自己的事业,我建议你先去了解一下 Y Combinator 的这篇文章《五个问题,确定你目前所开发的产品是否属于 AI 领域》。这样风投合伙人如果问起你相关问题,你就心里有数了。我向你打保票,他们一定会问的。这五个问题我摘出来,放到了下面,作为你识别、筛选人工智能技术公司的参考和标准:

(1)这家公司是否能针对你来做一次独立的项目演示?

为了避免有人在云端篡改你的数据,你要要求对方进行一次独立的演示,确保是真正有实际软件在处理你的数据。如果这家公司只能在云端处理数据,你必须再做很多评估工作,确保能处理这么海量数据的产品是可靠的。

(2)你是否能使用你自己的数据?

当公司在演示的时候只是使用它自己的数据,那么整个系统运行得特别好。但这并不意味着把你的数据换上来,系统同样不负众人期待。我的建议是:用你的数据来实时测试系统,保证它在实际情境中的效果如演示中一样。

(3)他们的数据源是什么?数据规模有多大?

如果没有大数据,AI 就无从谈起,正如人如果没有空气就无法生存一样。为了确保研发工作是有效的,应该提供的是真实可靠,真正意义上的大数据。而公司必须提供数据的规模、来源,大数据所具备着怎样的能力。尤其是要明确数据的来源。

一般性的数据来源:比如股价历史记录,政府数据,或者某些开源的项目。

(4)算法的细节是怎样的?

要多问公司一些算法的事,尤其是要了解它的细节内容,就比如说在这个产品中,神经网络的功能循环到底是怎样的。技术方法并不是什么商业秘密,所以公司是会愿意谈起的。如果他们闭口不谈,那么你就应该有所戒心了。

(5)他们是否已经有了一些客户?

如果已经有人用了这款产品,跟他们去好好聊聊。就比如说数字安全领域,其实存在着两种模式:「阻拦模式」「监控模式」,这两者之间是存在着巨大差异的,只有「阻拦模式」才能有效地降低「错误事件」出现的概率。

换句话说,你需要找到的那些客户,他们本身的诉求应该和你高度一致。


2. 如果不是 AI 所擅长的领域,请别把 AI 拉扯进来。

AI 的概念现在真的是红得发紫。但是,只有解决实际问题的,真正意义上的 AI 公司才能长久生存下来,其他的公司只是跟风,拿了风投,把钱烧个精光,到头来辜负了风投的信任。

也许在你的领域里有着最优秀的算法,但是如果你没有找到一个合适的方式来应用它,从而有效解决一个实际的问题,那么一切都无从谈起。真正好的人工智能技术必须依托在现实性强的应用方式上。就比如说 Google Photos,它使用了 Cloud Vision API 才达到如此出众的效果,但是你不知道它之前走了多少的弯路。

我是研发通讯应用人工智能的,对于很多人来说,这个领域的人工智能就等同于各种私人助手,管家,比如 Alexa 或者 Google Assistant。如今在一个通讯平台上,随便捣鼓一些就能拿出来一个类似的人工智能工具出来,但是,是不是真的能够解决问题,那就是另外一回事儿了。

要把产品和技术投放到真正能够实现价值的地方,就比如之前所提到的肺部癌细胞的分析预测。


3. 在研发过程中,你将需要大量的人力支持

这是我在 Y Combinator 里面学到的最大的一点收获。除非你现在是一家超大型的公司,像 Google 一样拥有大量的数据,在某些现成的,公共开放的数据上面做文章,否则你还是需要大量的人力支持的。这里的「人力」,我说的是用户,只有用户才能够产生出某一个专属的数据组,从而使得你的算法实现出应有的价值。

HealthTap 就是一个非常好的例子。他们在过去的七年时间里开发了一款极为成功的平台,上面有 107000 医生,对接着海量的医疗数据。如今,他们厚积薄发,在去年下半年终于开发出来了一款人工智能技术作为支撑的私人医生:Dr.AI。

Tesla 的自动巡航项目同样也是一个非常好的例子,展示了你应该如何利用你现有的用户基础来生成相当规模的数据量,从而支撑你进入到下一个开发阶段。无人自驾驶 AI 并不是终极目标,Tesla 最后要实现的目标就是要达到一个你完全不需要拥有一辆 Tesla 的汽车共享时代。当然,目前 Uber 是汽车共享里面的领头羊,它目前也正在开发自驾驶技术。

对了,我们还没有提到还得有人来给机器「教」这些算法。毕竟,就算你有大量的训练数据,你仍然需要人力在流程中去监管,校正模型。当然,随着机器智能的进一步完善,成熟,随着时间的推移,这个人力监管的必要也会降低。但是你要考虑到,你的错误率越低,你要对机器整体智能进行提升的困难程度也越大。至于什么时候真正能够摆脱人为去指导、干预,这得看人工智能投放到了哪个领域,有可能它会花好几年的时间。

所以,换句话说,你在项目一开始就必须提前将这些难度给考虑进去,预估出人工智能技术需要多长时间的孵化才可以面世。


最后的话:我们是干什么的?以及未来前进的方向

业界对人工智能的期望值,或者说人工智能的热度在 2016 年的年尾时达到了顶峰。而在 2017 年的一季度,随着 Facebook 在人工智能上愿景的回收,Apple 也被爆料在 AI 研发领域的进度远远低于人们的期待,似乎 AI 的时髦度开始有所回落。而对我们所研发的「混合式人工智能技术」而言,2017 年是让人无比期待的。

我们到底开发的是什么东西?是不是一款标准意义上的 AI 产品?人与机器是如何接合起来的。下面就容我跟大家做一个介绍。

我们 Bicycle AI 公司希望通过人工智能技术,去解决一个不同寻常的问题:客户服务

对于任何一家公司来说,客户服务绝对是必不可少的环节。光是在美国,有 260 万人在这份岗位上工作,这同样也是一个劳动密集型行业,而客户服务的进度总是很慢,效率总是很低。

在一些大公司里,客户服务工作总是几个小时就交接班,而对于一些小公司来说,来自于市场上的需求是极不稳定的,有时候很高,有时候又很低,公司很难找到与之相对应的客户服务资源,要么忙不过来,要么就是人浮于事。

Bicycle AI 提供的一个数字虚拟的「客服专员」,它的背后不仅仅是人工智能技术的支持,还有来自于人力的监管和引导。我们所提供这套解决方案能够保证客户服务工作 7 X 24 小时工作,而且响应速度极快。将所有简单的工作全部扔给它来处理,公司可以将更加宝贵的人力资源投入到具有更高价值的客户身上,更加复杂的售后案例上。

为了做到这一切,我们将之前客户服务所展开的对话记录,知识库,产品文档,以及其他资源进行了充分全面的整合。公司拥有 NLU 引擎这个技术专利,能够有效地识别信息输入。而且,当互动的次数越来越多,我们的机器学习算法会让 AI 给出更加精准的回应。


以上就是最近我在人工智能领域的一些感想和收获,希望能对大家有用。


·End·




推荐阅读

点击下方图片即可阅读

我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词_第2张图片

▲《中美AI创投研究报告》发布,解读AI创投浪潮的十大真相

我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词_第3张图片

▲不会技术、不懂销售都没有关系,创业者最必备的能力是——讲好故事 | 经验

我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词_第4张图片

不可错过的科技浪潮:会聊天的机器人?他们能做的事超乎你想象


我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词_第5张图片

你可能感兴趣的:(我在 YC 学到的三件事:如果不是 AI,麻烦请别滥用这个词)