MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GPT-3的1/7000,适合在普通个人GPU上快速训练。MiniMind 提供完整的训练流程代码,包括预训练、监督微调、LoRA微调、强化学习和模型蒸馏,支持多模态能力(如视觉语言模型MiniMind-V),兼容主流框架如transformers
和peft
。MiniMind开源了高质量数据集和自定义分词器,适合LLM初学者快速入门。


全部评论
留言在赶来的路上...
发表评论