1. 简化ChatGPT类型模型的训练和强化推理体验开发者只需一个脚本,就能实现多个训练步骤,并且在完成后还可以利用推理API进行对话式交互测试。2. DeepSpeed-RLHF模块DeepSpeed-RLHF复刻了InstructGPT论文中的训练模式,并提供了数据抽象...