阿里 orm
-
发布了文章 2个月前
R1-baidu09Omni – 阿里通义开源的全模态大语言模型
R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出强大的情感理解能力。...
-
发布了文章 2个月前
OmniTalker – 阿里推出的实时文本驱动说话头像生成框架
OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。核心架构为 Thinker-Talker 架构,Thinker 负责处理多模态...
-
发布了文章 2个月前
AtomoVideo – 阿里推出的高保真图像到视频生成框架
AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(I2V)生成框架,旨在从输入的静态图像生成高质量的视频内容。该框架能够保持生成视频与给定参考图像之间的高保真度,同时实现丰富的运动强度和良好的时间一致性。...
没有更多内容







