发布于: Android转发:0回复:0喜欢:0
进步真快
引用:
2024-06-28 04:00
本文作者:李丹
来源:硬AI
以ChatGPT掀起这轮AI应用热潮的OpenAI正在用行动证明,在基于人类反馈的强化学习(RLHF)领域,它也是先行者。
美东时间6月27日周四,OpenAI公布,其研究人员训练了一个基于 GPT-4 的模型,它被称为 CriticGPT,用于捕捉ChatGPT 代码输出中的错误。简单...