Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型,总共使用 12 万亿个token进行训练。专家混合MoE模型:稀疏1B和3B MoE 模型,分别具有 400M 和 800M 激活参数,总共使用 10 万亿个token进行训练。Granite 3.1支持128K令牌的上下文长度,能处理复杂的文本和任务。Granite 3.1引入全新的嵌入模型,覆盖12种语言,增强多语言支持。Granite Guardian 3.1模型具备功能调用幻觉检测能力,提升对工具调用的控制和可观察性。


全部评论
留言在赶来的路上...
发表评论