Skip to main content

Reward Model and RLHF

课程大纲

大模型评估 [课件]
对齐和RLHF [课件]

推荐阅读材料

致谢

感谢 Yixiu Liu 协助一起完成指令学习的课件。

课程大纲
推荐阅读材料
致谢