ChatGPT竞争对手Writer,获得1亿美元融资;面向不同任务微调Llama-2经验总结

ChatGPT竞争对手Writer,获得1亿美元融资;面向不同任务微调Llama-2经验总结_第1张图片

AI新闻

ChatGPT竞争对手Writer,获得1亿美元融资

摘要:美国生成式AI平台Writer宣布获得1亿美元的B轮融资。Writer提供类似于ChatGPT的功能,主要聚焦在企业领域,提供文本生成、总结摘要、文本纠错等服务。Writer自研了大语言模型Palmyra,并在医疗保健、营销、法律等领域进行了微调。它具备数据安全、操作透明和可解释性,并提供多种个性化功能。Writer适用于各种主流业务场景。

苹果发布会宣布内置Transformer语言模型的iOS和macOS

摘要:苹果在今年的WWDC发布会上宣布,将在新版本的iOS和macOS中内置Transformer语言模型,以提供带文本预测功能的输入法。一位名叫Jack Cook的技术爱好者通过研究macOS Sonoma beta,揭示了苹果的语言模型更像是基于GPT-2架构打造的。苹果的语言模型可以实现单词预测和纠错功能,主要用于输入法。模型被装在/System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle中,并通过分词器来处理输入文本。这一发现引发了人们对苹果用户体验和前沿技术应用之间平衡的思考。

AI行业流量分布及影响力分析

摘要:IT之家的分析师郎瀚威发布了“各个国别 + Top30 GenAI 流量分布图”,揭示了AI行业中不同国家的流量分布情况,并得出一些有趣的结论。其中Huggingface是中国流量第一,可汗流量主要来自发展中国家,美国流量在大部分网站中排名第一。另外,C站(Civitai)最大来源是日本,第三是中国,而印度在图表中也扮演了重要的角色。此外,ChatGPT是行业一哥,其访问量主要来自美国和印度。总体而言,这一分析给出了AI行业流量分布和影响力的整体状况。

淘宝上线AI大模型“淘宝问问”进行测试

摘要:淘宝AI大模型“淘宝问问”已上线测试,用户无需申请,升级至最新版即可体验。该模型使用深度合成算法,结合用户输入为其提供更符合消费习惯的商品和内容。用户可通过在淘宝App搜索框输入“淘宝问问”跳转到相关页面,并输入产品名称查看相关视频和文字介绍。尽管目前仍处于测试版,某些产品介绍可能不准确,但购买链接相对准确。用户还可向淘宝问问提问,获得推荐选项和原因。正式版上线时间待定。

Meta与雷朋合作推出下一代智能眼镜,内置AI并具备流媒体直播功能

摘要:Meta(Facebook)再次与雷朋合作,他们的下一代智能眼镜已通过FCC认证。该眼镜内置AI,并能在Facebook上进行流媒体直播。新眼镜代号为Supernova,相较于第一代眼镜更轻薄,具备改善的芯片效能和更大的电池容量,以支持流媒体直播。该眼镜仍未内置显示屏,交互需通过快捷按钮或手机,AI功能将通过语音助手调用。

AI知识

面向不同任务微调Llama-2经验总结

在这篇博客中,作者介绍了使用Llama-2模型进行微调的详细分析和实用指南。他们在三个真实世界的应用场景下对Llama-2模型进行了研究,发现微调可以显著提高准确性(在某些特定情况下,甚至比GPT-4更好)。他们通过实验展示了在ViGGO(从非结构化文本提取功能表示)、SQL生成和小学数学问题回答等任务上,微调小型Llama-2模型可以取得比GPT-4更好的性能。同时,他们也指出在数学推理和理解等任务上,经过微调的模型虽然比基础模型有所改进,但仍无法达到GPT-4的性能水平。他们使用Ray和Anyscale的微调和部署平台进行了实验,并提供了技术深入解析,包括问题的正确形式化、评估流程的设置等。他们还比较了提示工程、少样本提示和微调等方法,并给出了每种方法的优缺点。最后,他们希望通过本文所提供的细节,帮助其他人通过注重数据质量和评估流程,从Llama-2模型中获取更多价值。

GPT 3.5和Llama 2在SQL任务和功能表示任务中的微调效果

这篇文章主要是关于作者对比了GPT 3.5和Llama 2在SQL任务和功能表示任务上的微调性能,并得出结论GPT 3.5在准确性上稍微优于Llama 2,但训练和部署成本要高出4-6倍。作者认为对于初步验证/MVP工作,可以选择微调GPT 3.5,但对于其他情况,Llama 2是更好的选择。



更多AI工具,参考国内AiBard123,Github-AiBard123

你可能感兴趣的:(AI日报,chatgpt,llama)