本文更新于: 2024年11月8日
APP喵前言:阿喵发现了一个超棒的开源项目,叫做LLM-Dojo。这里聚集了一群对大模型训练和RLHF框架感兴趣的小伙伴们。LLM-Dojo用简洁明了的代码,支持各种主流的大型语言模型,比如Qwen、Llama、GLM等,还有DPO、CPO、KTO、PPO等强化学习方法。无论是想学习还是想自己动手魔改实验,这里都是个不错的选择哦!
项目简介
LLM-Dojo是一个开源的大模型学习场所,提供简洁易读的代码构建模型训练框架和RLHF框架,支持多种主流模型和强化学习方法,旨在便于学习和实验。
截图
特色
- SFT训练框架:支持Deepspeed多卡、Lora、QLora、全参等训练,自动适配chat template。
- RLHF框架:包括知识蒸馏、DPO、RLOO、SimPO等强化学习方法,适配Deepspeed多卡及Lora。
- 最新LLM tricks详解:持续更新大模型领域最新tricks介绍,包括新论文方法的复现。
- 技术发文:提供从零实现DPO、SimPO代码,包括数据、loss、训练等部分的详细讲解。
项目地址
https://github.com/mst272/LLM-Dojo
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。