Lynx Li
  • Home
  • Archives
  • Categories
  • Tags
  • About
February 16, 2025 pm
2 字 1 分钟 次

RLHF -- DPO

本文最后更新于:February 16, 2025 pm

RLHF – DPO

ongoing


AIGC > RLHF
#智能系统 #深度学习 #AIGC
RLHF -- DPO
https://jesseprince.github.io/2025/02/16/aigcs/rlhf/dpo/
Author
林正
Posted on
February 16, 2025
Licensed under
RLHF -- GRPO Previous
RLHF -- From Zero to PPO 代码篇 Next

Table of Contents

Search

Hexo Fluid
总访问量 次 总访客数 人