人工智能初创公司创办过程中的三个关键教训


全文共4375字,预计学习时长11分钟

人工智能初创公司创办过程中的三个关键教训_第1张图片

图源:unsplash

 

我是一家人工智能初创公司的技术联合创始人,然而我们并未取得成功。Pharma Foresight着眼于医药商业智能领域,下面是我们的电梯广告:

 

“目前制药公司的研发回报率低于资本成本,因此制药公司投资创新药物的利润越来越低。决定要进行哪些临床试验,获得批准的可能性是一个至关重要的指标,而这种指标目前正以一种非常主观且有偏见的方式来计算。我们的AI算法可以更准确地估计这个数字,它节省了时间和金钱,最终造福患者。”

 

我们有一个很强大的团队,并采用精益创业策略进行快速迭代;我们与各种不同的利益相关者进行了接近100次的访谈,以确定早期的产品购买者并验证了他们对我们产品的需求;仅仅4个月后,我们就与一家大型制药公司的全球投资组合管理办公室合作,该公司支付了我们构建模型的费用,我们也保留了所有的知识产权。

 

然而,尽管遵循了很多初创公司的成功经验,PharmaForesight还是失败了。由于时运不济和判断失误,我们最终并没有成功。

 

这次失败让我更清晰地明确了一个道理:人工智能初创公司与SaaS初创公司采用的策略和方法是有微妙的区别的——但这并没有得到广泛认可。这篇文章的目的就是讲述我们曾犯的错误,避免更多的AI初创公司重蹈覆辙。

 

首先,什么是人工智能初创公司?

 

有很多初创公司声称他们使用人工智能,但实际上,他们使用的只是外包的人工劳动力或是基本的统计技术。伦敦MMC Ventures的一项研究发现,40%的所谓人工智能初创公司实际上并没有使用人工智能。

 

而本文的观点是,如果没有相对现代的机器学习技术,人工智能初创公司是不可能存在的。比如,Poly.ai如果没有深度的学习算法就不可能存在。

 

这与那些只有部分产品使用了AI的公司形成了鲜明对比。例如,Spotify就在机器学习上投入了大量资金,而且机器学习如今已成为其战略的核心。但是,Spotify在以一种协调的方式使用机器学习之前就已经存在了。对我来说,它更像是一个SaaS公司。

 

从这个角度出发,我将向你介绍我在创办人工智能初创公司中学到的一些经验。

 

1.专有数据是关键

人工智能初创公司创办过程中的三个关键教训_第2张图片

图源:unsplash

在商业情景中,思考人工智能的最佳方式是将其视为一种底层的支持技术,就像20世纪80年代出现的SQL数据库一样。SQL创造了价值数十亿美元的行业,比如客户关系管理。同样,人工智能将创造新的行业,并在大量商业用例中实现改进。

与SQL数据库一样,人工智能也依赖于数据。数据远比算法重要,这一点是公认的。高质量的专有数据对人工智能初创公司来说至关重要。

事后看来,我们的数据策略是错误的。最初,我们选择了更快更容易的方法——在公开的数据上构建工具的第一个版本。清洗和转换数据为机器学习做好准备,这花费了大量的时间,而当时的我们认为这其中有一定的可靠性。我们还以为,一旦我们获得了一定的可信度,那么访问更有趣、更可靠的专有数据集就要容易得多了。

事实证明,这些假设中有许多都是错误的。当开始构建模型时,我们找不到任何人来处理这个问题,但当我们完成模型构建时,又出现了许多竞争对手。即使我们的算法更精确,也难以与更成熟的竞争对手区分开来,尤其是似乎大家都使用了相似的数据。

构建模型似乎并没有让访问专有行业的数据集变得更容易(尽管我们当时资金用尽,否则我们无疑可以对此进行更彻底的测试)。对人工智能公司来说,访问专有数据集绝对是关键。

一般来说,有三种获取专有数据集的方法,而且它们不会相互排斥:

 

·        通过创建初始产品或服务的方式来收集数据,当用户与之交互时,该产品或服务会生成数据,这些数据随后可以用于改进产品或服务。例如Facebook、谷歌、Spotify和其他很多类似的网站都是这样。

 

·        通过手动收集一个小型专有数据集的方式来收集数据。这种方式可以用来训练初始的机器学习模型,此时模型需要表现得足够好,才能至少满足一些早期购买者的需求。随后的合作关系将使数据收集的规模得以扩大,从而可以改进模型等。Hoxton Analytics就是采用这种方法的公司之一。

 

·        与数据持有者(通常是大公司或公共机构)进行交易。例如,Sensyne Health已经与英国的几个国民医疗服务联合体(NHS Trusts)达成了一项交易。

   

在这三种选择中,我推荐第三种,原因如下:

 

如果你选择第一种,说明你并不是一家人工智能初创公司。因为你可以在没有人工智能的情况下提供服务,所人工智能对于你所能做的事情显然不是必要的。当然,人工智能可能会极大地改善你的产品或服务,但它必须足够优秀才能够收集到大量的用户数据。

 

如果选择第二种,还是很有可能创建一个人工智能初创公司的,但是为了能让成功几率最大化,初始数据集需要充足的利基市场,或者与现有的解决方案相比,你的方法需要足够创新。遵循这种方法的风险在于,在发展合作伙伴以收集大量数据之前,你的想法和数据集很容易被竞争对手复制,特别是当你处理一个广为人知的用例时。

 

这么看来,创建人工智能初创公司的关键途径就剩下第三种了——与大的数据持有者进行交易,以获取他们的数据。这就是绝大多数人工智能初创公司都是B2B的原因。

 

大型机构和公司通常行动迟缓,与他们交易通常需要一定的时间。是否允许另一家公司访问数据可能存在伦理或商业上的顾虑,这个问题也有待解决。但总的来说,公司会越来越意识到他们所持有数据的价值。

 

当然,还有一些人工智能初创公司并没有遵循上述任何一项选择,而是凭借自身算法的优势取得了不错的业绩,例如DeepMind(2014年被谷歌以5亿美元收购)和MagicPony(2016年被Twitter以1.5亿美元收购)。但这条路是很艰难的,在没有专有数据集的情况下,要保持竞争优势要困难得多。

 

2.为人工智能初创公司筹集资金非常困难

筹集资金是创业过程中最困难的部分之一。这一过程中其实包含很多技巧:讲好故事、推销、商业头脑、法律等等。为一家人工智能初创公司筹集资金则格外有挑战性。

人工智能初创公司创办过程中的三个关键教训_第3张图片

图源:unsplash

我们原本以为,如果创业的想法和团队足够强大,并且有足够的吸引力,那么我们就能够筹集到资金。然而,我们大错特错了。

创业之初时就考虑可能的资金投入至关重要。不同的资助者有不同的目标和限制,从一开始就认识到这些是很重要的。早期创业的两大出资人是:

·        技术风险投资(VC)——对早期公司的机构投资者。在创业初期,他们主要关注三个方面——强大的团队、庞大的市场规模和良好的初始吸引力。

 

巨大的市场规模至关重要。由于风投通常会将大量资金投入风险极高的企业,他们会预计自己的大部分投资都会破产。所以为了投资成功,他们不仅需要看到超过10倍的回报,还需要看到时间周期在5年之内的回报。这意味着如今风投支持的公司通常是专注于颠覆大型行业的SaaS初创公司。

 

如果你接受了风投,那么创始团队通常对公司的控制权较小。大多数风投者坚持持有优先股(如果公司以低于他们投资价值的价格出售,那么你可以收回股权)和摆脱创始团队的能力(尽管这一点很少践行)。

 

·        天使投资者——天使投资者的形式和规模各不相同。有的希望与风投一起投资,而有的则希望能提供更稳定的资金。天使投资通常意味着你保留对自己的企业拥有更多控制权。在英国,除非你有良好的人脉,或者之前有过成功的创业经历,否则很难筹集到超过50万英镑的天使投资。大多数天使投资者会在10年左右之内退出。

    

基于上述的限制,为人工智能初创公司寻找投资格外有挑战性。

   

首先,人工智能初创公司通常比SaaS初创公司需要更长的起步时间。人工智能算法依赖于数据,而大的数据持有者通常是大公司,而通过任何方式获取获取大公司持有的数据都是很耗时。即使你可以访问数据,你不仅需要关注业务开发和软件平台(和在SaaS初创公司一样),还需要关注人工智能算法。

 

考虑到你需要更专业的技能,加之更长的起步时间,这意味着通常需要更多的资金来启动一家人工智能初创公司,这些资金需要是“稳定资本”。对大多数创始人来说,这就排除了长期天使投资的可能性(除非你人脉非常广)——因为所需的资金数额实在是太大了。

 

但当你向风投推销时,就是在与传统的SaaS公司竞争。如果一切顺利的话,这些SaaS公司可能会获得更快的回报。SaaS是一种很有吸引力的商业模式,它有定期的经常性收入,而且即使用户不经常使用该服务,他们也会忘记取消订阅。

 

在过去的十年里,SaaS商业模式对风投来说是非常成功,很多风投都陷入了这种思维模式中,但这种思维模式并不适用于很多人工智能初创公司。很多人说对我们说:“有了订阅收入后再来找我们。”

 

大多数人工智能初创公司会发现,至少在最初几年,你很难产生订阅收入,你需要采用一种完全不同的商业模式。你的提议需要更有说服力,才能筹集更多的资金。

 

3.根据用例,可解释性是关键

即使你有专有的数据集和出色的产品,也并不一定意味着你的产品会取得成功。如果你正在创办一家人工智能初创公司,一定要对人工智能和机器学习有一定的了解。然而,一般人并不熟悉这些话题,他们还可能会怀疑自己的潜力。

简单来说,你需要令人信服的证据来证明你的模型能顺利运行。现场演示可能有效。如果还不足以为信的话,那就尝试使用具体的、精心挑选的例子,而不是高精确度的数字。这听起来可能有悖常理,如果你有数学背景的话会更有体会。

能够解释模型的预测将增加人们对模型的信任。根据你的用例,能清楚地解释你模型的每一种预测通常与精确度同样重要。可解释性是一个很宽泛的话题,但总的来说,你的解释要尽可能得让人容易理解。

经验法则是,每个个体的预测越重要,其可解释性就越重要。

人工智能初创公司创办过程中的三个关键教训_第4张图片

图源:unsplash

人工智能是一项令人惊叹的赋能技术,毫无疑问,它将在未来几年对我们的生活产生难以置信的影响。但这并不意味着创立一家人工智能初创公司很容易——其实困难远非如此。

我逐渐了解到创立人工智能初创公司有许多独有的困难,有许多方面没有得到充分的重视。在创立了PharmForesight之后,我坚信亨利·福特(Henry Ford)的名言:“真正的错误是我们没能从错误中学到经验。”

 

前车之鉴后事之师,我们犯过的上述错误,希望各位可以引以为戒。


推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:朱颜、闫欣阳

相关链接:

https://medium.com/swlh/three-crucial-lessons-for-launching-an-ai-startup-976d1d44f370

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

你可能感兴趣的:(人工智能,算法,大数据,编程语言,区块链)