AMD-baidu09135M – AMD推出的首款小型语言模型

baidu09_com 2025-08-27 32 0

AMD-135M是AMD推出的首款小型语言模型（SLM），为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型架构，在AMD Instinct MI250加速器上训练，基于670亿个token，AMD-135M分为两个版本，通用文本的AMD-Llama-135M和针对代码的AMD-Llama-135M-code。AMD-135M采用推测解码技术，能在每次前向传递中生成多个token，提高推理速度减少内存占用。在性能方面，AMD-135M 在各种自然语言处理任务上的表现与市场上其他同类模型相当。例如，在 Humaneval 数据集上使用 MI250 GPU 时，实现大约 32.31% 的通过率，是一个强大的性能指标。