推理文字题
-
发布了文章 2个月前
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理 本文第一作者肖光烜是麻省理工学院电子工程与计算机科学系(MIT EECS)的三年级博士生,师从韩松教授,研究方...
没有更多内容
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理 本文第一作者肖光烜是麻省理工学院电子工程与计算机科学系(MIT EECS)的三年级博士生,师从韩松教授,研究方...
没有更多内容