Lynx Li
  • Home
  • Archives
  • Categories
  • Tags
  • About
February 16, 2025 pm
2 字 1 分钟 次

RLHF -- GRPO

本文最后更新于:February 16, 2025 pm

RLHF – GRPO

ongoing


AIGC > RLHF
#智能系统 #深度学习 #AIGC
RLHF -- GRPO
https://jesseprince.github.io/2025/02/16/aigcs/rlhf/grpo/
Author
林正
Posted on
February 16, 2025
Licensed under
01-EM Models Previous
RLHF -- DPO Next

Table of Contents

Search

Hexo Fluid
总访问量 次 总访客数 人