一个“Scale AI”,让整个国内数据标注行业都酸了!

23岁、美籍华裔、E轮融资3.25亿美元、估值达到73亿美元、AI创业公司(数据标注方向)。

上面是目前美国硅谷的一家名为“Scale AI”的以数据标注为核心业务的创业公司5年所取得的成绩。无疑是对国内还在数据标注行业苦苦挣扎的小伙伴们是一剂强心剂,但也却感觉非常尴尬。

强心剂的原因是,国内的大部分标注公司不管是头部的还是下游的供应商的境遇都还是非常挣扎的,被所谓的”劳动密集型“等行业问题所困扰,无法破圈。而非常尴尬来说,国内的数据标注规模化发展是早于国外的,在经过几年的野蛮生长之后,对行业期望不断降低的情况下,还是需要远在硅谷的晚起步的公司引领方向。

这一点或许还是让我们看到了,虽然在场景应用领域国内的确很容易规模化并且处于领先地位,但是在行业发展方向和科技引领的角度,我们或许缺乏思维突破和全球视野。

一个“Scale AI”,让整个国内数据标注行业都酸了!所以本文主要和大家聊一聊“Scale AI”引发的一些思考,从一下几个方面进行讨论:

  • Scale AI公司的相关信息

  • 国内数据标注公司的相关情况及融资情况

  • 对相关事情的思考和讨论

一.Scale AI公司的相关信息

ScaleAI由时年19岁的AlexandrWang在2016年创立,先后服务于Waymo、Toyota、Lyft等公司,为客户公司提供用于机器学习的数据标注服务。

四年前,年仅19岁的Alexandr Wang从麻省理工大学辍学,同年在完成了硅谷创业扶持公司Y Combinator的孵化项目后,和22岁的Lucy Guo一同创办了Scale AI。

Alexandr Wang出生在美国新墨西哥州,父母均是物理学家。早在高中的时候,Wang因在编程比赛上的出色表现,陆续接到科技公司的工作邀约,并在硅谷开启了自己的职业生涯。

去年在接受Bloomberg Technology的采访时,Alexandr Wang表示,“我在硅谷工作的这段时间里,看到人工智能领域目前存在的形形色色的问题,因而了解到机器学习的重要性。”

依据这家公司截至到2020年8月的数据来看,Scale AI本年年营收有望达到8000万美元,相比2018年的400万美元年营收有大幅增长。据截至2020年8月的营收数据,Scale的2020年营收预计将达到8000万美元,相比2018年的400万美元增长整整19倍。实际上,Scale在2019年中期的营收就已增长至4000万美元。

一个“Scale AI”,让整个国内数据标注行业都酸了!_第1张图片

图1.Scale AI融资情况

视频1.Scale AI CEO采访视频

一个“Scale AI”,让整个国内数据标注行业都酸了!_第2张图片

图2.国内数据标注行业市场规模及增长情况

从目前的信息来看,我们梳理一下,上面的内容:

  • Scale AI创办的时间也是人工智能第三次浪潮的元年,数据标注行业的元年。

  • Scale AI有非常好的技术背景。

  • Scale AI初期的客户主要是自动驾驶相关的客户。

  • 提供AI数据平台,通过平台的方式让人们更有效益和有效率,尽可能地以一种科技驱动的方式解决问题。融合机器学习和相关技术来最大化处理过程的效率和质量。

  • 非常好的融资节奏。

  • 2020年9月拿下美国国防部的9100万美元大单,协助美国军方试验、开发、更新用于机器学习和AI的标注数据集。

  • 目前是全球估值最高的人工智能数据标注公司。

  • 目前Scale AI的估值是预测的2021年国内标注市场规模的11倍,是预测的国内2025年国内标注市场规模的4.67倍。是不是有些不可思议呢?

Scale AI的故事相比于国内的数据标注投融资的故事相差不多,或许某些内容不及国内的标注公司故事精彩。但为什么会差别如此的大呢?

二.国内数据标注公司的相关情况及融资情况

接下来我们来看一下,国内相关公司的融资情况。

一个“Scale AI”,让整个国内数据标注行业都酸了!_第3张图片

图3.国内数据标注公司融资事件

一个“Scale AI”,让整个国内数据标注行业都酸了!_第4张图片

图4.每年数据标注公司发生投融数量

一个“Scale AI”,让整个国内数据标注行业都酸了!_第5张图片

图5.相关标注公司融资轮次排序

一个“Scale AI”,让整个国内数据标注行业都酸了!_第6张图片

图6.相关投资公司投资情况

由上面的数据我们可知:

  • 2021年发生投融资的公司有2家。

  • 数据标注行业最受最受追捧的时间是2017年。

  • 大部分公司依然停留在A轮左右的阶段。

  • 公开披露的一共有56家不同的投资机构参与了数据标注行业的投资。

  • 有4家投资机构进行了两轮投资分别是IDG资本、伽利略资本、金沙江创投、九合创投。

  • 梅花创投在数据标注行业参投公司最多为3家,分别是莫比嗨客、爱数智慧、微蓝智能。

三.相关事情的思考和讨论

“Scale AI”的发展的确是给行业带了非常大的振奋,在羡慕别人家孩子的同时也反思一下我们为什么没有破局呢?

这部分从主观和客观的角度阐述一下我个人的思考。

首先从客观的角度来看,孕育公司的国情和产业结构不同的。

  • 美国人力成本高,必须通过技术平台的方式解决跨国数据生产的问题。

    这个问题也会倒逼相关行业内企业必须先从技术的角度解决整体数据流程生产的各个存在的问题。而国内在这个行业发展的过程中再次体现出了人口红利带来的便利。

  • 国内的人工智能产业结构划分更细

    在应用场景的人工智能发展来看国内的确领先于其他国家,也导致了在工程学角度人工智能的流程化被划分的非常细,这样的弊端就是价值被稀释了,例如“四小龙”这类的AI技术厂商也处于了很尴尬的位置,AI技术厂商是可以像上下游延伸,相比国内数据标注公司一定是有技术优势的。而在场景化AI的流程化生产应该是更依赖数据的,本应是数据标注公司的优势,但是目前国内的数据标注公司能提供更多的是标注单一环节的服务,无法提供类似“Scale AI”针对终端传统客户需求场景的整体解决方案。

其次从主观的角度来看:

  • 整个行业错过了2018年的那次发展机遇

    回顾行业发展个人认为2018年是行业发展的关键时期,2018年及之前不论从发展态势还是项目利润率的角度都是可观的,可支持行业公司发展的。但是整个行业在技术投入和商业模式上没有更多的突破,反而更依赖人力成本转移带来的短期收益。目前从整体的角度来看,由于短期的人力成本转移所带来的短期收益也没有在整体发展上起到决定性的作用,或许由于流程中产生的内耗非常大,消耗掉了大部分的收益,从而在规模上没有达到预期效果,技术上也没有得到良好的积累。

    而反观Scale AI在2018年到2019年的技术升级和主要赛道的选择上应该是更遵循了发展初心。

  • 发展格局受限

    在之前也写过一篇文章-【标注小课堂】数据标注的价值不是数据标注。

    主要聊的也是关于行业发展的问题,有感兴趣的小伙伴可以看看。

    a.国内在定义标注行业来看局限在了标注服务本身,其市场体量就很有限了,如图二中显示预测的2021年的标注市场规模仅为43亿,2025年才101亿元。作为这样个市场规模和发展方向,就是我作为投资人也会慎重考虑的。但真的是这样么?

    b.行业的发展是一个肉眼可见的速度内卷的过程,我个人认为大部分从业者发展格局是主要问题,在之前的一篇文章中我们讨论了行业客户(干货!你们要的客户都在了......),这部分是对内的客户。还有一部分是提供对外服务的,而由于国内的人工智能场景化应用发展的比较快,所以对外应该会是能力输出一块非常好的战场。而大部分的国内公司是不具备这个能力的。

    数据标注本应该是一个非结构化数据标准化生产和各个行业资源匹配协作的过程,通过不断用技术的手段提升效率和质量,从而实现人工智能场景化的快速落地,并且通过敏捷生产的方式极大降低人工智能在场景化应用的难度。而不是局限于解决标注问题。

    不管是在国内还是在国外,很长一段时间都会是数据占主导的地位。

    不过有一点在其他报道里面我是不认同的,报道中提到了每年产生的多少ZB的数据都是需要标注的,但不是所有的数据都需要进行标注的,而是根据算法需求,也会对数据价值进行评估后,对于算法来说高价值的数据进入人工标注,对于算法来说低价值的数据用算法自动处理就好了,这就需要平台来进行处理了。这部分会再单独写一篇文章单独讨论,这里就不重点讨论了。

  • 行业发展内卷严重

    之前写过一篇文章里面讨论过数据标注发展的几个阶段看大佬怎么说“数据标注师”的发展之路。从这几年的发展来看,行业价格快速透明,大部分都以价格低为核心优势,更有甚者在某些行业群里直接就发布日薪150元就可以甚至更低,看似聪明却自断后路。

    在这个过程中还是体现出了国内人口红利的优势,由于人的资源获取极为便利,导致很大程度的平台技术发展及应用就不是那么迫切了。例如在很多项目中,平台公司的标注工具或者甲方的标注工具极大的影响工作效率和工作质量,虽然过程中不断反馈,但很多时候很难得到响应,或者有些项目干脆就用线下工具来进行实施。即便是如此难用了,项目还是可以通过加人或者换人的方式来完成,最终的财务风险成本基本上都会被最终的实施环节人员所承担。

    如此下来资源优势、技术优势都没有得到很好的积累,并且随着内卷加剧会导致目前整个行业的项目财务模型已经基本无法支撑行业内公司的正向发展,形成恶性循环,又如何支持起来更高的市值呢?

那么对于“Scale AI”我们只能望洋兴叹了么?我个人认为绝对不是的,我依然看好行业的发展,只是我认为目前标注行业内部的公司,未来的主要竞争对手可能不会是目前的彼此,而是现阶段提供AI技术支持或者服务的公司。这部分公司也正在进行分流,一部分有实力的会向人工智能产业链的上游发展,例如芯片、软硬结合的方向。一部分会向更靠前的业务端、需求端发展,提供敏捷开发的AI技术支持。第二部分自然就会和目前数据标注的长期发展方向重叠。

按照这个思路来看,目前的“Scale AI”的市值就可以理解了,如果做类比的话,应该是国内的偏业务端、需求端提供AI技术支持服务的公司加上数据标注公司整体的市值才是一个量级的。

但是从目前来看双方各有各的优势,几经较量还不一定花落谁家?我们拭目以待,依然从业的小伙伴们更需要加油了。

-----------------------完---------------------

公众号:AI数据标注猿

知乎:AI数据标注猿

CSDN:AI数据标注猿

-----------------------------------------------

你可能感兴趣的:(数据标注,人工智能,数据分析,人工智能)