Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特点,在消费级 GPU 上能运行多个长上下文(128K)任务,性能接近 Granite 3.3 2B Instruct,内存需求减少约 72%。模型用创新的混合 Mamba-2/Transformer 架构,结合 Mamba 的高效性和 Transformer 的精确性,支持无位置编码(NoPE),能处理极长的上下文长度。

Granite 4.0 Tiny Preview – IBM推出的语言模型  第1张
(图片来源网络,侵删)
Granite 4.0 Tiny Preview – IBM推出的语言模型  第2张
(图片来源网络,侵删)