Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适配能力,支持英伟达多款GPU及国产芯片,打破了对特定硬件(如英伟达Hopper架构)的依赖。 在性能方面,在A800集群上部署-671B时,相比部分国外开源框架,GPU使用量减少50%,推理速度提升3.15倍。支持从纯CPU到大规模集群的全场景部署,能满足不同规模和场景下的推理需求。

赤兔Chitu – 清华联合清程极智开源的大模型推理引擎  第1张
(图片来源网络,侵删)
赤兔Chitu – 清华联合清程极智开源的大模型推理引擎  第2张
(图片来源网络,侵删)