清华大学推理社
-
发布了文章 2个月前
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架 在 ChatGPT 爆火两年多的时间里,大语言模型的上下文窗口长度基准线被拉升,以此为基础所构建的长 CoT 推理、多 Agent...
没有更多内容
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架 在 ChatGPT 爆火两年多的时间里,大语言模型的上下文窗口长度基准线被拉升,以此为基础所构建的长 CoT 推理、多 Agent...
没有更多内容