【[52星]awesome-direct-preference-optimiza

【[52星]awesome-direct-preference-optimization：DPO研究的宝库，为语言模型优化提供系统性框架。亮点：1. 提供4个维度的详细分类，涵盖数据策略、学习框架等；2. 包含多种数据质量、反馈方式和优化方法；3. 汇集众多前沿论文，助力研究者快速上手】

'Awesome Direct Preference Optimization: A list of selected papers in our survey paper titled "A Survey of Direct Preference Optimization"'

GitHub: github.com/liushunyu/awesome-direct-preference-optimization