想尝试不同的模型大小和配置？DeepSpeed-Chat轻松实现！

工具软件3年前 (2023)发布 AI观察员

487 0 0

我们了解到用户通常喜欢尝试不同的模型大小和配置，以满足他们不同的训练时间、资源和质量的需求。借助 DeepSpeed-Chat，你可以轻松实现这些目标。例如，如果你想在 GPU 集群上训练一个更大、更高质量的模型，用于你的研究或业务，你可以使用相同的脚本，只需输入你期望的模型大小（例如 660 亿参数）和 GPU 数量（例如 64 个 GPU）：

python train.py --actor-model facebook/opt-66b --reward-model facebook/opt-350m --num-gpus 64

在接下来的9 小时内，你将拥有一个 660 亿参数的 ChatGPT 模型，并可以在你喜欢的前端 GUI 中使用：

Model Sizes	Step 1	Step 2	Step 3	Total
Actor: OPT-66B, Reward: OPT-350M	82 mins	5 mins	7.5hr	9hr

表 5. 在8个DGX节点上（64x A100-80G），针对不同的RLHF步骤，使用DeepSpeed-Chat训练OPT-66b所需的时间。

如果你只有大约 1-2 小时的咖啡或午餐休息时间，你也可以尝试使用 DeepSpeed-Chat 训练一个小型模型。例如，我们为单个数据集准备了一个 13 亿参数模型的训练示例，以便在你的消费级 GPU 上测试我们的框架。当你从午餐休息回来时，你的模型已经准备好供你使用！

python train.py --actor-model facebook/opt-1.3b --reward-model facebook/opt-350m --num-gpus 1

Model Sizes	Step 1	Step 2	Step 3	Total
Actor: OPT-1.3B, Reward: OPT-350M	2900 secs	670 secs	1.2hr	2.2hr

表 6. 在单个消费级A6000-48G上，针对不同的RLHF步骤，使用DeepSpeed-Chat训练OPT-1.3b所需的时间。

# 工具软件

文章版权归作者所有，未经允许请勿转载。

ChatGPT 如何使用抽象语法树？

AI观察员

443

如何使用树莓派迷你电脑搭建AI家庭安防系统

AI观察员

406

Midjourney 6 Consistent Styles 功能和本周更新

AI观察员

436

如何在 Windows 11 上下载 OptiFine

AI观察员

375

Facebook 宣布 Facebook 群组的几项新功能

AI观察员

415

ShiftDown 减少 Windows 上的进程负载以加快速度

AI观察员

458

天猫U特购 京东优惠购 京东优惠天猫优惠

想尝试不同的模型大小和配置？DeepSpeed-Chat轻松实现！

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍

利用 DeepSpeed-Chat 的 RLHF API 自定义你自己的 RLHF 训练流程

相关文章

你或许会喜欢