DeepSpeed 第4页

推荐频道

DeepSpeed

如何优雅地训练大型模型？

前阵子微软开源了DeepSpeed训练框架，从测试效果来看有10倍的速度提升，而且对内存进行了各种优化，最大可以训练100B(illion)参数的模型。

Datawhale·2020-07-14 00:29

AI 四巨头 Google、DeepMind、Microsoft、Uber 深度学习框架大比拼

GPipe、Horovod、TFReplicator和DeepSpeed分别是这四家公司开发应用的深度学习框架，它们结合了深度学习研究及其基础设施的前沿技术，以提高深度学习模型的训练效率。

CSDN资讯·2020-06-20 20:20

170 亿参数！微软对内发布最强模型 Turing-NLG

通过DeepSpeed深度学习库，以及ZeRO优化的技术带来的突破，这个庞大的模型得以被训练而出。而在多项基准测试方面，Turing-NLG也达到了最优异的水平。

HyperAI超神经·2020-02-12 14:17

微软开源深度学习优化库 DeepSpeed，可训练 1000 亿参数的模型

微软日前开源了一个深度学习优化库DeepSpeed，通过提高规模、速度、可用性并降低成本，可以在当前一代的GPU集群上训练具有超过1000亿个参数的深度学习模型，极大促进大型模型的训练。

itwriter·2020-02-12 10:00

微软分享史上最大基于Transformer架构的语言生成模型

微软AI＆Research今天分享了有史以来最大的基于Transformer架构的语言生成模型TuringNLG（下文简称为T-NLG），并开源了一个名为DeepSpeed的深度学习库，以简化对大型模型的分布式培训

喜欢打酱油的老鸟·2020-02-11 09:29

微软分享史上最大基于Transformer架构的语言生成模型

作者：周蕾微软AI＆Research今天分享了有史以来最大的基于Transformer架构的语言生成模型TuringNLG（下文简称为T-NLG），并开源了一个名为DeepSpeed的深度学习库，以简化对大型模型的分布式培训

itwriter·2020-02-11 09:00

上一页 1 2 3 4 下一页

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他