构建 AI 应用:开源 infra 项目指南

近半年,AI 相关工具的发布不断更新了大家的认知,好用的新工具在不断涌现,搭建 AI 应用的门槛在逐渐降低,方便开发者更简单快速地构建酷炫项目 - 因此,我们收集了一些可以直接拿来构建 AI 应用的开源 infra 项目。

构建 AI 应用:开源 infra 项目指南_第1张图片

Chroma

出道半年,Chroma 今年四月初宣布了 1800 万美金种子轮。它是一个向量嵌入(embedding)存储,嵌入是 AI 原生表示不同类型数据的方式,因此也是与 AI 驱动的工具和算法的完美选择。
虽然已经有不少向量数据库解决方案,但 Chroma 团队认为都不够开发环境友好(没有找到想要的东西,所以就自己来写一个),它内置了你搭建 AI 应用在嵌入存储方面会需要的所有东西,只要 pip install chromadb 就可以了,无需配置或者额外安装别的东西。

构建 AI 应用:开源 infra 项目指南_第2张图片

因为羡慕,所以再来看一眼他们星光璀璨的资方列表。

构建 AI 应用:开源 infra 项目指南_第3张图片

Langchain

LangChain 2022 年 10 月发布,是一个能使开发 AI 应用程序更加灵活的框架。
LLM 虽然可以执行许多任务,但无法为某个深入领域知识或专业知识的问题提供具体答案。LangChain 可以看作是个衔接工具,方便开发者将不同的 prompt "链" (chain) 在一起⛓️。链条可以由多个模块的多个组件组成,包括:

  • 大型语言模型(LLMs):比如 GPT-3, BLOOM 等。
  • 代理:决定应该采取什么行动。可以使用网络搜索或计算器等工具,并将所有的操作打包成一个逻辑循环。
  • 记忆:短期或长期记忆。

你可以把一连串命令连在一起,这样 AI 模型就可以知道它需要做什么,产生什么答案,或者执行什么任务了。

构建 AI 应用:开源 infra 项目指南_第4张图片

比如 Chroma 和 LangChain 就可以无缝一起运行:开发者使用 LangChain 构建 LLM 应用程序背后由 Chroma 提供动力。

GPTCache

GPTCache 是 Zilliz 开发的 LLM 语义缓存层。

比如你开发的 AI Chatbot 越来越受欢迎,流量逐渐变大,可能会出现的问题包括调用 API 的费用变高,响应速度变慢。GPTCache 就是为了解决这类问题而诞生的,其实 Zilliz 开源 GPTCache 也是因为他们的问答机器人 OSSChat 遇到了性能逐步下降、服务费用不断增加的情况。

构建 AI 应用:开源 infra 项目指南_第5张图片

除了提升性能和节省开销,用户可以根据自己的需求(输入类型,输出格式,响应长度等)自定义缓存规则,最大化缓存效率。以及 - GPTCache 也已经跟 LangChain 完全集成了。

Dify

Dify.AI 是一个开箱即用的 LLMOps 平台,提供了可视化的 prompt 编排,运营,数据集管理等功能,创建有用的 AI 应用变得更加方便了。

它提供了一些常用的应用模板(比如他们就有一个 SQL Creator 的模板,可以给你生成 SQL 语句)

构建 AI 应用:开源 infra 项目指南_第6张图片

所以即便不是开发同学,也可以自己做简单的 LLM 应用并且直接给别人使用,进阶一点可以接入自己数据集,选择 LLM 模型,数据标注等等,开发者之后可以持续改进和调整 prompt。

构建 AI 应用:开源 infra 项目指南_第7张图片

Stable Diffusion

Stable Diffusion 是由 stability.ai 开发的一个 ML 模型,可以从文本中生成图像。stability.ai 去年十月已经完成了 1.01 亿美元的融资,它可以在你自己的机子上跑(对显卡要求可能比较高),其它一样出名的 AI 作画模型包括 DALL·E 2 和 Midjourney,看了一些对比,感觉每家都各有千秋,只能说各取所需吧。
Stable Diffusion 是开源的,所以基于或围绕它的项目也很多,比如 Stable Diffusion 的 prompt 搜索引擎,Figma 和 PS 的插件等等。

构建 AI 应用:开源 infra 项目指南_第8张图片

前不久,Stability AI 宣布开源了 AI 图像生成平台 StableStudio,也是 DreamStudio 的开源版本,背后的模型是最新的 SDXL,可以在线生成,编辑,修复 AI 图像了,这是要 one up Midjourney 的节奏吗️。

总结一下

看了一眼这些项目的 Star History,发现这些项目的共同特点就是都很年轻,发布时间最早的至今也不满一年,去年六月想可能都是脑洞大开的事儿,今年已经变成我们日常生活工作不可少的一部分了。

构建 AI 应用:开源 infra 项目指南_第9张图片

因为 Stable Diffusion 有个 head start... 我们去掉它,对齐一下时间线再来看看

构建 AI 应用:开源 infra 项目指南_第10张图片

合理多了!之前也说到过 AIGC 的爆发带动了许多附属产品和生态的增长,接下来大火的产品又会是什么呢?
P.S. - 如果你用过提到的工具,欢迎留个言呀!


你可以访问官网:https://www.bytebase.com/,免费注册云账号,立即体验 Bytebase。

你可能感兴趣的:(构建 AI 应用:开源 infra 项目指南)