数据科学简讯 2023-03-24


头条


GitHub Copilot X

Copilot 即将推出新的对话界面、GPT-4 升级、错误修复建议、文档编写和自动拉取请求。这些发布是 GitHub 成为开发者工具包强国目标的下一步。

谷歌和微软的聊天机器人在错误信息的对决中相互引用

根据 The Verge 上的一篇评论文章,微软、谷歌和 OpenAI 等大型科技公司仓促推出 AI 聊天机器人有可能破坏网络的信息生态系统。作者举了一个例子,微软的 Bing 聊天机器人错误地指出谷歌的 Bard 聊天机器人已经被关闭,并引用了一条推文、一条 Hacker News 评论和假新闻作为证据。这篇文章表明,人工智能语言模型无法区分事实与虚构,可能会在整个网络上释放出一系列错误信息和不信任,而且这些公司对机器人进行实验的免责声明是一种站不住脚的辩护。

Nvidia 进入基础模型即服务(foundation models as a service)

机器人、图像、文本、简历等等! Nvidia 已经将他们的帽子扔进了戒指。基础模型即服务将在企业领域首次亮相,为专有数据提供量身定制的解决方案。凭借其多模式功能,该平台可以处理一系列数据类型,包括文本、图像、视频,甚至 3D 内容,允许构建定制的多模式语言模型和生成模型以适应特定用例。与 Getty Images、Shutterstock 和 Adobe 等行业领导者的合作确保版权问题得到有效解决。


研究


我们其他人的 Data Deduplication

围绕重复数据删除的有用性争论的双方都有很多论文。无论如何,对同一个数据点进行 300,000+ 次训练似乎是一种浪费。这里一个简单的重复数据删除技术是嵌入你的数据点,聚类成 k(例如,10k 个聚类),然后删除与其他数据点具有非常高余弦相似性的子集。这种技术似乎对嵌入的选择和集群的数量很稳健,只要集群足够高。它也适用于各种模式。

Text to Room

从来没有一个社区比目前的生成 AI 社区对室内设计更感兴趣。这项工作非常符合当前的趋势。他们需要做很多新颖的调整才能使整个 3D 空间与提示对齐。总之,非常有趣的 3D 资产生成工作。

FreeDoM:一种无需训练的条件扩散模型

本文介绍了 FreeDoM,这是一种无需训练的条件扩散模型,它利用现成的预训练网络来构建与时间无关的能量函数,从而能够在各种条件下进行有效生成。所提出的方法在简单、有效和低成本方面具有优势,并且比现有的免训练方法具有更广泛的应用范围,如在不同数据域(包括图像和潜在代码域)上的实验所证明的那样。


工程


ChatLlama (Website)

围绕指令调整的Alpaca 模型的一个很好的包装器接口。目前只有 70亿参数模型可用,其他型号即将推出。虽然质量不及 ChatGPT,但它是一个有代码的有趣的开放替代方案。

Generative models for medical (GitHub Repo)

朝着评估、创建和管理生成模型迈出的重要一步,适用于各种任务,特别是医学。该项目旨在通过为生成性医疗任务构建工具来提供帮助,并提供指标和教程来帮助用户入门。


杂七杂八


人工智能是下一个技术垄断吗?

由于构建其中一些 AI 系统需要巨大的资金需求,因此尚不清楚它们是否会以人们希望的方式颠覆和带来创新。它们难以复制且不透明,但可以作为建立大量公司的基础。

Mozilla 推出专注于可信赖人工智能的新初创公司

Firefox 浏览器的开发商 Mozilla 正在启动一家 AI 初创公司,以构建开源且“值得信赖”的 AI。 Mozilla 执行总裁兼 Mozilla.ai 负责人 Mark Surman 表示,这家新成立的公司名为 Mozilla.ai,其使命不仅仅是构建任何人工智能——它的使命是构建开源且“值得信赖”的人工智能.

摩根斯坦利和 OpenAI

摩根士丹利正在使用 OpenAI 的 GPT-4 为内部聊天机器人提供支持,帮助财富管理人员查找相关信息。关于投资策略、市场研究和分析师见解的大量信息存放在许多内部网站上,主要以 PDF 格式提供,需要顾问浏览大量信息以找到特定问题的答案。该模型将对财富管理内容进行全面搜索,“有效解锁摩根士丹利财富管理的累积知识”。

斯坦福大学下架 Alpaca

斯坦福大学的研究人员以成本和安全问题为由取消了 Alpaca。

视频游戏开发商 Ubisoft 正在使用 AI 编写对话

流行视频游戏《刺客信条》的发行商育碧现在正在使用一种名为 Ghostwriter 的人工智能工具来帮助为其游戏编写对话。

Next.js ChatGPT (GitHub Repo)

Next.js ChatGPT 是一个负责任的聊天应用程序,由 GPT-4 提供支持。

The HustleGPT Challenge (GitHub Repo)

HustleGPT Challenge 是一个精选的 HustleGPT 列表。

你可能感兴趣的:(数据科学简讯 2023-03-24)