玩酷网

【[52星]awesome-direct-preference-optimiza

【[52星]awesome-direct-preference-optimization:DPO研究的宝库,为语言模型优化提供系统性框架。亮点:1. 提供4个维度的详细分类,涵盖数据策略、学习框架等;2. 包含多种数据质量、反馈方式和优化方法;3. 汇集众多前沿论文,助力研究者快速上手】

'Awesome Direct Preference Optimization: A list of selected papers in our survey paper titled "A Survey of Direct Preference Optimization"'

GitHub: github.com/liushunyu/awesome-direct-preference-optimization

语言模型优化 偏好优化 研究资源 人工智能 ai兴趣创作计划