一些有意思的人工智能发展状况数据


随着大型语言模型(LLM)的引入,机器学习(ML)和人工智能(AI)首次被日常开发人员所使用。这些令人感觉很神奇的应用程序,甚至是拥有数十亿研发支出的,在以前连大型科技公司几乎不可能构建的软件,现在突然变得不仅有可能,而且能够构建和共享。


人工智能的创建上升趋势始于2021年,在2022年迅速增长,并在2023年上半年爆发。随着越来越多的LLM提供商(如Google、OpenAI、Cohere、Anthropic)和开发工具(如ChromaDB、LangChain)的出现,开发速度有所提高。与此同时,生成代码的自然语言接口使得其创建比以往任何时候都更容易被更多的人访问。


在这里分享一些关于人工智能发展状况的统计数据。


人工智能的创建


自2022年第四季度以来,我们看到人工智能项目呈爆炸式增长。截至23年第二季度末,有近300000个与人工智能相关的不同项目。相比之下,对GitHub的搜索显示,在同一时间段内,只有约33k个OpenAI存储库。

一些有意思的人工智能发展状况数据_第1张图片


其中约160000个项目是在23年第二季度创建的。这是季度环比增长约80%,年环比增长34倍。而且继续看到这些数字在加速增长。


这些项目中的大多数都在使用OpenAI。当我们比较提供商时,OpenAI在市面上占主导地位的人工智能项目超过80%。OpenAI GPT-3.5 Turbo模板目前拥有8000多个forks。但有迹象表明,情况可能正在发生变化。


一些有意思的人工智能发展状况数据_第2张图片


在23年第2季度,我们看到:

OpenAI项目跨越+125k(增长80%)

相干项目跨越+1k(增长100%)

Anthropic和Google项目保持<1k



LangChain的出现

人工智能活动中最著名的名字之一是LangChain。使用LangChain作为其中一些模型的包装器加速了开发,并且继续被大量采用。

一些有意思的人工智能发展状况数据_第3张图片


截至23年第二季度,Replit上有近25000个活跃的LangChain项目+其中2万个是在该季度创建的,比上一季度增长了400%。


需要注意的是,LangChain围绕LLM提供者提供了足够的抽象,使开发人员可以轻松切换。该项目的发展可能在新LLM提供商和开源LLM的兴起中发挥了作用。


由Mckay Wrigley创办的Takeoff School开设了一门名为LangChain 101的课程,今天人们可以在这里开始学习LangChain。该项目即将通过1000个forks。


开源模型的兴起

我们还看到利用开源模型的项目在增加。Hugging Face和Replicate是两个API提供者和SDK,它们是开源模型的重要入口点。

一些有意思的人工智能发展状况数据_第4张图片


在23年第二季度,我们使用开源模型的项目超过了5000个。累计数量同比增长141%。超过70%的项目利用了Hugging Face,但Replicate的使用量增长了近6倍的QoQ。



编程语言的分类

有趣的是,我们看到Python和JavaScript的增长速度非常相似,Python是人工智能开发中稍微常见的语言。然而,JavaScript在第二季度的增长速度略快。

一些有意思的人工智能发展状况数据_第5张图片

值得注意的是,项目可以有Python和JavaScript。两者并不相互排斥。许多(如果不是大多数的话)项目都有Python后端和JavaScript前端。


有趣的是,语言因地理位置而异。某些地区使用JavaScript而不是Python。


一些有意思的人工智能发展状况数据_第6张图片

在过去的90天里,约有5万名Python开发人员:

美国:32%

印度:11%

英国:7%

加拿大:3%

巴西:3%


然而JavaScript看起来非常不同。在约3.4万名JavaScript开发人员中,当中各地区占比:

美国:22%

印度尼西亚:10%

印度:9%

越南:7%

菲律宾:5%


人工智能领域的JavaScript开发人员更倾向于亚洲,而Python开发人员则更倾向于北美。印度的代表性似乎相对均衡。


他们在建什么

正在构建的应用程序非常出色,我们不可能在这里公正地对待所有应用程序。超级令人兴奋的是,人工智能正在为新一代创业者构建以前不可能的应用程序铺平道路。示例包括:

CampLingo:生成语言学习产品。

NodePad.space-人工智能的视觉构思。

魔法学校-教育工作者的人工智能工具。

MightyDeals AI-在互联网上达成价格合理的交易(故事)。

带有LeapAPI的AI化身-创建专业或主题头像的模板。

BabyAGI-一个可以读写自己代码的代理。


从支持服务不足的情况,到现在能够采取自己行动的自主主体,这些项目每天都在发展,并且非常迅速。

你可能感兴趣的:(AIGC,人工智能,大模型训练,人工智能)