每日一看大模型新闻(2023.12.20下)大模型+搜索构建完整技术栈,百川智能搜索增强给企业定制化下了一剂「猛药」;谷歌发布最重要23个产品时刻,其中15个有关AI;微软Azure发布GPT-RAG

1.产品发布

1.1谷歌发布新大语言模型:零样本生成10秒视频达SOTA!

发布日期:2023.12.20

谷歌发布新大语言模型:零样本生成10秒视频达SOTA!网友:压力给到Runway/Pika

主要内容:谷歌最新发布的大语言模型VideoPoet,能够实现零样本生成视频。该模型不仅没有使用常见的扩散模型,而且画面稳定、动作逼真,清晰度也大幅提升。VideoPoet具备多种能力,包括文本-视频、图像-视频、视频编辑、风格化处理、画面补充等。用户可以通过输入文本或图像来生成视频,并可以调整视频长度、动作和风格。此外,VideoPoet还能根据视频内容自动生成音频,并且可以根据视频的最后一秒画面预测下一段视频。VideoPoet的优势在于利用了现有的大型语言模型进行改进,使用了T5的编码器。通过视频/音频tokenizer,VideoPoet克服了离散token带来的挑战,实现了高质量的视频生成效果。

1.2谷歌推视觉语言模型PixelLLM

发布日期:2023.12.20

谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐 - 知乎

主要内容:通过与加州大学圣迭戈分校合作,谷歌AI研究团队推出PixelLLM,实现了细粒度定位和视觉-语言对齐。PixelLLM采用密集对齐策略,成功解决了大型语言模型在细粒度定位任务中的挑战。在密集目标描述、位置条件描述和引用定位等视觉任务中,PixelLLM表现出卓越性能,取得最先进的结果。通过引入新的视觉-语言模型,PixelLLM为实现更精确的视觉-语言对齐和定位提供了新的可能性。该模型通过在语言模型的每个输出单词与像素位置建立密集对齐,成功解决了大语言模型在定位任务中的挑战

2.技术更新

2.1大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」

发布日期:2023.12.20

大模型+搜索构建完整技术栈,百川智能用搜索增强给企业定制化下了一剂「猛药」

主要内容:面对各行各业的垂直场景,依靠网络公开信息和知识预训练的通用模型很难搞定准确性、稳定性、性价比等问题。百川智能已经将这种最新的技术思考融入到其大模型产品之中,并正式开放了基于搜索增强的 Baichuan2-Turbo 系列 API。这些 API 不仅支持 192K 的超长上下文窗口,还增加了搜索增强知识库的能力,所有用户均可上传特定文本资料构建自身专属知识库,根据自身业务需求构建更完整、高效的智能解决方案。同时,百川智能也升级了官网模型体验,正式支持 PDF 文本上传以及 URL 网址输入,普通用户均可通过官网入口体验长上下文窗口和搜索增强加持后的通用智能水平的飞升。

2.2 2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍

发布日期:2023.12.20

2080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍

主要内容:上海交大IPADS实验室推出的开源推理框架PowerInfer,通过结合上海交大IPADS实验室推出的开源推理框架PowerInfer,通过结合大型模型的独特特征和CPU与GPU间的混合计算,使得大模型推理速度加快了11倍。该框架能在显存有限的个人电脑上实现快速推理,例如24G的4090显卡可以运行原本需要16万元的80G A100显卡完成的工作量。此外,PowerInfer还支持量化模型的推理,使得消费级硬件上可以流畅运行30-70B规模的模型。PowerInfer的出现解决了高性能显卡价格高昂的问题,使得个人电脑用户能够在本地运行先进的大型语言模型,推动了人工智能应用的普及化

2.3轻松集团:自研大模型升级 发布七大AI+健康应用

发布日期:2023.12.20

轻松集团轻松健康自研大模型全面升级 七大AI+健康应用发布

主要内容:轻松集团旗下的医疗健康服务平台轻松健康宣布,他们自主研发的垂直领域大型模型“轻松问医Dr.GPT”已全面升级。同时,轻松健康还发布了基于该大型模型研发的七大应用,以满足不同应用场景和用户群体的特定需求,包括“智能问诊系统”、“个性化健康管理顾问”、“慢性病管理计划”、“心理健康指导师”、“医学知识库和技能培训平台”、“辅助诊疗助手”、“患教内容智创平台”,覆盖健康管理服务的各个场景应用。

2.4微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案

发布日期:2023.12.20

微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案 (chinaz.com)

主要内容:微软Azure最近推出了GPT-RAG,为大型语言模型提供超智能解决方案,确保在企业中更顺畅地运行,旨在满足对LLMs的需求。解决方案自动调整大小,高峰期也保持良好性能。采用前瞻性设计,包括潜在集成Cosmos DB进行分析存储。遵循零信任原则,确保敏感数据得到谨慎处理,提供高度信息安全。

2.5斯坦福大学开发AI模型PIGEON 仅通过几张照片找到你的位置

发布日期:2023.12.20

斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置_中文科技资讯 提供快捷产业新资讯 创新驱动商业

主要内容:PIGEON模型可以通过图像准确预测位置,准确率高达92%。模型基于OpenAI神经网络CLIP进行训练,另外还有PIGEOTTO模型。论文探讨了模型的伦理问题,如隐私问题,但也指出了其积极用途和潜力。

3.商业动态

3.1实在智能完成近2亿元C轮融资,领跑中国Agent商业化落地

发布日期:2023.12.20

实在智能完成近2亿元C轮融资,领跑中国Agent商业化落地_互联网_艾瑞网

主要内容:近日,“实在智能”宣布完成近2亿元C轮融资。本轮由金泰富资本和安吉智慧谷共同领投,安吉两山国创跟投。实在智能计划在2024年初,对Agent进行市场公测。针对个人用户,实在智能将推出解决长尾、低频自动化需求的PC助理,针对政府企业,公司则计划推出员工办公助手。实在智能从AI+RPA(机器人流程自动化)领域发轫,迄今已为2000余家数字政务、运营商、金融、能源、交通等领域大型客户部署各类“数字员工”

3.2谷歌发布最重要23个产品时刻,其中15个有关AI

发布日期:2023.12.20

23 new products Google launched in 2023

主要内容:谷歌在官网发布了 2023 年最重要的 23 个产品时刻,其中有 15 项涉及到 AI 或生成式 AI,包括 Gemini 大模型的发布、推出 AI 聊天机器人巴德、基于生成式 AI 的搜索生成体验功能、安卓更新 AI 壁纸等功能、推出第一款 AI 原生手机 Pixel 8 Pro、推出 AI 驱动的笔记本电脑 Chromebook Plus、推出智能手表 Google Pixel Watch 2、推出 AI 照片编辑工具 Magic Editor、AI 智能撰写功能扩展到 Google Chat、推出 AI 助手 Duet AI、将 Duet AI 扩展到谷歌云、推出 AI 虚拟试衣、为 YouTube 添加 AI 功能、推出 AI 搜索实验室、浏览器 Chrome 新增 AI 功能等。

3.3 VR市场仍然不断萎缩 Meta和苹果能否逆势崛起

发布日期:2023.12.20

VR市场仍然不断萎缩 Meta和苹果能否逆势崛起_凤凰网

主要内容:根据研究公司Circana的数据,2023年美国AR和VR设备的销售额暴跌近40%,至6.64亿美元。尽管VR市场仍在萎缩,但Meta仍投入数十亿美元实现其“元宇宙”梦想。然而,目前还没有一个突破性的成功来支撑这一愿景。Meta旗下开发VR和AR技术的Reality Labs部门第三季度的销售额为2.1亿美元,但亏损了37亿美元。分析师认为,Meta的Quest 3有潜力在企业任务中引起轰动,而且设备价格只有500美元。随着苹果计划在明年推出Vision Pro混合现实头显设备,市场将关注苹果对VR市场的影响。

你可能感兴趣的:(人工智能,计算机视觉,自然语言处理,prompt,语言模型,chatgpt,embedding)