- 作者:Chris Dixon
- 时间:2015年2月1日
- 原文:The idea maze for AI startups
- 翻译:梅晨斐,校验:曾樑
“想法导图”的意思是,一家特定领域的创业公司需要思考的产品关键要素和利益权衡。
”一个好的创始人能够明确区分那条路能通向成功,哪种选择可能导致失败。而不合格的创始人只能沉浸在“电影、音乐、文件共享、P2P、图片社交”等一大推名词当中,而对整个行业的历史一知半解,对这个领域里现在的玩家和已经倒闭的玩家都不熟悉,对可能带来领域变革的技术也不清楚。“ - Balaji Srinivasan, Market Research, Wireframing and Design
我觉得整理一份我感兴趣领域的“想法导图”很有意思。下面是我对”人工智能“这个领域的一些想法,之后将逐一详解每个模块:
"拥有80-90%准确度的最简可行产品”。一种传统的说法是:“机器学习是一种非常有用的技术,能够解决几乎所有问题。” 而对大部分我们遇到的问题来说,构建一个能够达到80-90%精准度的模型也并不复杂。模型构建完成之后,我们获取反馈、募集资金、获得数据、快速消亡。大部分情况下,构建一个精准度达到八成的模型只需要几个月,但是如果要继续优化并且提高精准度的话,可能需要好几年的时间。(顺便提一句,这就是为什么一些大型公司做出类似Watson或自动驾驶汽车的产品原型并没有花很多时间。但是关键是,看他们如何处理那10-20%的边缘情况。即如何处理在光线不充足的条件下,突然闯出的一条狗。)
面临这种情况时,你有两种选择。1、继续提高精准度,企图接近100%,2、在现有精准度的条件下,马上开发产品,产出的是所谓“有错误但可接受的用户体验”。
苹果iOS系统上的自动补齐,以及Google搜索引擎上的自动填充推荐,就是刚才提到的第二种选择的产品代表。当然,你可以质疑Google的搜索引擎自动填充并不是非常典型的代表,因为Google在你输入搜索关键词的时候,会自动为你提供10个可能相关的搜索建议,而不是直接给你一个相关性最高的结果。但是,构建这个一个并不完美的系统并不意味着妥协。但是,不同的精准度要求意味着产品在架构选择上的区别。(特别是,当你需要人工和机器一起工作的时候,反馈延时是非常重要的,而这点也会影响技术架构的选择。)
好的,让我们假设你选择第一条路,继续提高产品的精准度。接下来具体该如何操作呢?你无法通过简单的算法提高精准度。唯一可操作的方式是,你需要有大量的练习数据来帮助你调整产品模型,所以数据是这一切的关键。因为,一、我们已经有了精准的算法和计算资源,数据是现在唯一缺失的部分,二、。开放数据从某种方面来说,并不是很好的解决方案。最好的数据源,要么根本不存在,要么掌握在私人公司手里无法获取。
“领域细分”。多数情况下,你需要的数据的量与你希望解决问题的宽度是正相关的。所以在你真正着手收集数据之前,你需要先弄清楚你的目标领域。与其计划做一个尝试解决所有问题的机器人,不如专心完成一个能够帮助人们安排会议的智能系统。与其做一个尝试预测所有未来的云端系统,不如完成一个能够预测欺诈交易的系统。
“继续领域细分”。当你已经明确细分的领域之后,你要做的就是继续不断往深度上挖。假设你想做的产品是X,那么你要做的不是直接开发产品X,而是先开发基于X的最小产品原型。我的建议是,不断细分深挖你想做的产品,直到不能再细分为止。与其开发出最后没有人需要的产品,不如在前期多花一点一时间。扩张的事情,都可以在后面慢慢再做。
“那么具体如何获取数据呢?” 大体上也有两种获取途径。1、自己手动获取,2、通过众包的方式获取。一个典型的案例就是Google地图与Waze。Google派遣上千人每天开车去获取道路、建筑和交通的数据信息。而Waze则鼓励他们的百万用户自动帮助Waze收集数据。如果遵循Google的方式开发产品,那么你在启动产品之前就需要一笔至少上亿美金的融资支持。
所以作为一家创业公司,剩下的数据获取途径只剩两种,1、从公开渠道获取,2、众包。
从公开渠道获取的典型案例就是:[Wikipedia](www.wikipedia.org
[)。当然你可以狡辩说,这就像Google早期时候从各种渠道通过爬虫去爬网页链接,用来优化它的搜索算法。不过据我了解,有很多的创业公司都尝试从Wikipedia上爬取大量数据,但是没有几家公司真正做出什么成绩。
最后剩下的切实可行的办法就是:“众包”。这种方式的关键是,如何设计一套有效的机制,能够鼓励普通用户收集数据,最后反馈到产品,帮助进行优化。接下来我将以去年我们投资的一家公司Wit.ai举例,Wit想要提供的服务是,帮助开发人员解决语音转化文字的功能,以及自然语言处理的问题。1.0版本推出以后达到了部分效果,但是并不很理想。之后,公司推出了一套仪表界面和开放API,使得开发人员可以自己纠错来优化结果。所有的用户(开发人员)可以免费使用这套云端服务,同时用户会自动帮助整套系统来修复一些算法和数据上的问题。Facebook之后收购了Wit。但是他们采取的整套做法值得其他AI创业公司借鉴。
上图是我对AI领域的一些理解。以下是一些忠告:1、我在上文中提到的一些想法不完全是正确的,初衷是促进交流,而不是为了给大家洗脑,2、就像Balaji所说的,我们相信新的AI开发技术在未来将会给人们的生活领域带来非常多革命性的变革。