DeepSpeed

DeepSpeed

深度学习优化库,简化分布式训练。

访问官网

价格

付费 / 免费增值

产品介绍

DeepSpeed是一个深度学习优化库,专注于提高分布式训练的效率和效果。它通过提供多种技术创新,如ZenFlow、Arctic Long Sequence Training (ALST) 和SuperOffload,来实现极高的训练速度和大规模模型训练的能力。DeepSpeed支持PyTorch和TensorFlow等流行的深度学习框架,并提供了深度编译优化、自动Tensor Parallel Training等功能。它还支持低精度和低延迟的训练,极大地降低了训练成本。DeepSpeed的核心API不断更新,支持最新的深度学习技术,例如PyTorch-style backward和低精度master states。DeepSpeed使得训练大型语言模型如BLOOM和MT-5成为可能,推动了深度学习领域的前沿发展。

同类推荐