一提到神经搜索 (Neural Search) ,有些朋友难免会发怵,自己没有丰富的 AI 开发以及工程经验,能玩得转吗?
别慌,今天我们将为大家介绍一个新产品--Jina NOW:只需一行代码即可创建和部署神经搜索解决方案。
观看视频,Jina AI 首席工程师 Florian Hoenicke,5 分钟带你了解并实操 Jina NOW:
多模态?跨模态?一行代码解决非结构化数据搜索问题,NOW 它来啦
如果你是第一次接触 Jina,对 Jina 全家桶还没有充分的了解,那么 Jina NOW 绝对算得上最佳入门产品。
你可以将其理解为神经搜索即服务 (neural search-as-service),借助 Jina 预置的功能,开发者只需一行代码,就可以创建和部署神经搜索解决方案。
Jina Now 具有以下特点:
便于使用:没有强大的工程能力和技术背景,也可以快速上手。
运行迅速:几分钟内即可使用自定义数据创建 demo。
结果调优: 对于已标注的 Document,Jina NOW 提供开箱即用的结果微调深度学习模型
快速迭代:支持快速构建原型,实时验证想法。
稳定可靠:复杂搜索解决方案的部署和维护,将由 Jina 后端基础设施提供支持。
Jina NOW 的使用方法简单,轻量化操作只需 2 步,即可完成一个神经搜索系统的创建:
1、安装 Jina NOW
pip install jina-now
注意:请使用 Python 3.7+;截至目前 Jina NOW 仅支持文本及图片两种数据类型,后续版本中将不断丰富支持的数据类型。
2、启动 Jina NOW
安装完成后,在终端输入以下代码进行启动:
jina-now start
出现以下文字说明时:
用户可以选择使用预置数据或自定义数据,快速创建一个搜索解决方案。
加载自定义数据并上传至 Jina NOW,可以通过以下方式:
* DocArray pull id
* DocArray URL
* 本地挂载路径
添加数据后,你可以选择图片画质以及部署设置(本地或云端部署)。
选择完成后,Flow 将启动,15-20 分钟后出现一个弹窗页面,如下图所示:
如此轻松地,一个用 Jina NOW 创建的神经搜索系统,就顺利完成啦!
Emojipedia 是一个 Emoji 参考网站,截至 2021 年 9 月,其网站上的 Emoji 数量已经高达 3,633 款。
尽管数量众多,Emojipedia 网站的搜索方式,却还在使用最原始的关键字搜索。
这种搜索方法有时候并不准确,搜索系统常常因为用词、拼写或上下文等原因,无法准确识别用户意图,这使得用户体验非常不好。
接下来,我们将尝试用 Jina NOW 创建基于语义搜索的解决方案,进而解决这个问题。
1、安装 Jina NOW
2、查找并加载数据集
本示例中,我们使用的是 Kaggle 上的 Emoji Image Dataset
3、按照上述步骤,启动 Jina NOW。
收到消息弹窗后,选择自定义,按照提示加载数据、选择图像质量并设置部署。
完成后,继续嵌入向量和索引图像数据,该过程大约持续 15-20 分钟。最后用 Streamlit 生成一个预加载的前端交互页面。
结果如下:
Jina NOW 利用语义搜索创建的 Emoji 搜索系统,可以更高效准确地搜索到匹配的 Emoji
以上就是本期教程的全部内容!什么?太简单了?这正是 Jina NOW 的最大优势:任何人都可以非常轻易地上手实现!
心动不如行动,最低成本的 Jina「体验装」,记得来社区分享你的 use case 哦!
Q1:开发过程出现报错或 Bug,如何解决
A:访问 GitHub Repo 在对应的产品下提交 Issue 或 PR
Q2:如何加入社区、参与讨论?
A:我们目前支持 Slack 社区以及微信公众号社群:
Slack:英文社区,与来自全球的 Jina 用户探讨最新的应用场景及技术发展趋势。
微信群:中文社区,结识更多国内同行,探索 Jina 本土化应用场景,私信进群。
Q3:如何获取社区支持,宣发个人项目?
A:私信 我们,我们将依据项目情况及开发者需求,帮助开发者在社区提高个人影响力。
Q4:新手如何入门 Jina 全家桶?
A:从这些资料开始,了解 Jina 生态、,开启你的神经搜索之旅:
Learning Portal(英文):从入门到精进,3 个等级的学习资料及课后测验,助力你成为神经搜索高手。
微信公众号(中文):访问「往期教程」,查看最佳实践。