首页 > 文本模型训练过程

文本模型训练过程

baidu09_com

发布了文章 2个月前

北大团队提出LIFT：将长上下文知识注入模型参数，提升大模型长文本能力

北大团队提出LIFT：将长上下文知识注入模型参数，提升大模型长文本能力长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长序列（文本、语音、视频等），有些甚至长达百万级 tokens。扩充模型的长...
AI人工智能

0 28 0
baidu09_com

发布了文章 2个月前

大模型长文本阅读能力如何评估？

大模型长文本阅读能力如何评估？长文本处理能力对LLM的重要性是显而易见的。在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k，然而今日，128k的上下文长度已经成为衡量模型技术先进性的重要标志...
AI人工智能

0 31 0

没有更多内容

关灯返回顶部