文本模型训练过程
-
发布了文章 2个月前
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力 长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。扩充模型的长...
-
发布了文章 2个月前
大模型长文本阅读能力如何评估?
大模型长文本阅读能力如何评估? 长文本处理能力对LLM的重要性是显而易见的。在2023年初,即便是当时最先进的GPT-3.5,其上下文长度也仅限于2k,然而今日,128k的上下文长度已经成为衡量模型技术先进性的重要标志...
没有更多内容











