匿名发表论文
-
发布了文章 2个月前
匿名论文提出奇招!增强大模型长文本能力居然还能这么做
匿名论文提出奇招!增强大模型长文本能力居然还能这么做 一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用...
没有更多内容
匿名论文提出奇招!增强大模型长文本能力居然还能这么做 一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用...
没有更多内容