首页 > 阿里 orm

阿里 orm

baidu09_com

发布了文章 2个月前

R1-baidu09Omni – 阿里通义开源的全模态大语言模型

R1-Omni 是阿里通义推出的基于强化学习（RLVR）的全模态大语言模型，专注于情感识别任务。通过结合视觉和音频信息，能清晰地解释情感识别的推理过程，展现出强大的情感理解能力。...
AI工具

0 33 0
baidu09_com

发布了文章 2个月前

OmniTalker – 阿里推出的实时文本驱动说话头像生成框架

OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术，能同时处理文本、图像、音频和视频等多种模态输入，以流式方式生成自然语音响应。核心架构为 Thinker-Talker 架构，Thinker 负责处理多模态...
AI工具

0 34 0
baidu09_com

发布了文章 2个月前

AtomoVideo – 阿里推出的高保真图像到视频生成框架

AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频（I2V）生成框架，旨在从输入的静态图像生成高质量的视频内容。该框架能够保持生成视频与给定参考图像之间的高保真度，同时实现丰富的运动强度和良好的时间一致性。...
AI工具

0 41 0

没有更多内容

关灯返回顶部