语言模型lm
-
发布了文章 2个月前
迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试
迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试 本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院...
-
发布了文章 2个月前
LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」
LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」 图是组织信息的一种有用方式,但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法,显著提高LLM...
-
发布了文章 2个月前
入选NeurIPS 24,浙大团队提出全新去噪蛋白质语言模型DePLM,突变效应预测优于SOTA模型
入选NeurIPS 24,浙大团队提出全新去噪蛋白质语言模型DePLM,突变效应预测优于SOTA模型 具有强大泛化能力...
-
发布了文章 2个月前
大语言模型的解码策略与关键优化总结
本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs 中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面的技术参考。主要涵盖贪婪解...
没有更多内容
















