DeepSeek-R1T-Chimera 是TNG科技公司推出的开源语言模型。结合 和两种模型的优势,基于创新的构建方法,将两者的神经网络组件融合,非简单的微调或蒸馏。模型在基准测试中展现出与 R1 相当的推理能力,运行速度更快,输出标记数量减少 40%,效率显著提升。DeepSeek-R1T-Chimera推理过程更加紧凑有序,避免 R1 模型可能出现的冗长和散漫问题。DeepSeek-R1T-Chimera 的模型权重已公开在 Hugging Face 上,支持在 openrouter 上免费使用。

DeepSeek-baidu09R1T-baidu09Chimera – TNG开源的语言模型  第1张
(图片来源网络,侵删)
DeepSeek-baidu09R1T-baidu09Chimera – TNG开源的语言模型  第2张
(图片来源网络,侵删)