摘要:OpenAI在ChatGPT中引入了一个新功能,允许用户在聊天时任意@一个GPTs(即ChatGPT最新推出的AI Agent 智能应用)。这个功能的引入让人们可以在聊天中随意@群里各路高手,确保@到的AI智能体会知无不言,言无不尽,使得ChatGPT的GPTs能力可以在任何已存在@符号使用习惯的场景里长驱直入,畅通无阻。因此,@GPTs功能让ChatGPT的GPTs能力和人们早已熟知的@操作自然联系起来,使得AI Agent的参与变得更加自然和便捷。
摘要:Vary-toy是一款大小不到2B的多模态大模型,能够通过消费级显卡进行训练。这项研究由旷视、国科大、华中大的研究人员共同提出。Vary-toy具备文档OCR识别、视觉定位、图像描述、视觉问答等多项功能。目前,Vary-toy的代码和模型已开源,并提供了在线demo供试用。
摘要:谷歌Bard在最新的第三方LLM排位赛中击败GPT-4,排名第二,距离排名第一的GPT-4 Turbo差距很小。这一成就引起了广泛关注,因为Bard是基于较小规模的Gemini Pro-scale模型实现的。尽管Bard在排行榜上取得了显著成绩,但仍有人对其解决实际问题的能力表示怀疑。此外,OpenAI在同一天发布了新的GPT-4 Turbo模型,引发了业界对AI模型性能的进一步讨论。
摘要:百川智能推出了参数达千亿的大语言模型Baichuan 3,声称在中文任务评测上超过了GPT-4。Baichuan 3在医疗逻辑推理评测上同样表现出色,成为“中文医疗任务最佳大模型”。训练过程中采用的技术手段如动态数据选择和异步CheckPoint存储等,保证了训练的稳定性和故障恢复速度。Baichuan 3还突破了迭代式强化学习技术,提升了语义理解和生成能力,尤其在诗词创作方面表现显著。百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。Baichuan 3模型已上线百川智能官网,供公众体验。
摘要:谷歌研究院推出了名为Lumiere的“文生视频”扩散模型,使用了自家的“Space-Time U-Net”基础架构,能够一次生成“完整、真实、动作连贯”的视频。这与业界常见的“分段生成视频”方法不同,后者先产生关键帧再通过时间超级分辨率技术生成视频,难以保证视频的连贯性和真实性。Lumiere一次可以生成80帧视频,研究人员表示,5秒视频长度已经超过大多数媒体作品中的平均镜头时长。Lumiere建立在预先训练的“文生图”模型基础上,通过空间超分辨率模型和Multidiffusion通用生成框架提升模型稳定性,保证了视频的一致性和连续性。
当前存在大量矢量数据库及检索工具的现状,提出了两种不同的观点。一方面认为已经存在足够多的选择,而另一方面则认为需要专注于重新思考检索问题,并预测智能公司将会投入更多的资金和精力来解决这个领域的问题。最终可能会形成类似于传统搜索引擎的全面检索和排序系统,但会包含更多的人工智能和聊天体验等功能。
OpenAI在2023年取得了巨大成功,但随后面临了一系列挑战。公司可能会面临大量诉讼,因为其AI系统可能侵犯版权。此外,公司请求政府放宽版权法规定,引起了争议。另外,公司的利润和市场地位可能会受到竞争的影响。AI系统可能存在真实性问题,且难以修复。公司也面临监管压力和内部矛盾。最终,OpenAI可能会因为种种问题而失去之前的无限潜力和魅力。
更多AI工具,参考国内AiBard123,Github-AiBard123