阿里达摩院啥意思
-
发布了文章 2个月前
WorldVLA – 阿里达摩院联合浙大推出的自回归动作世界模型
WorldVLA是阿里巴巴达摩院和浙江大学联合推出的自回归动作世界模型,模型将视觉-语言-动作(VLA)模型与世界模型整合到一个单一框架中。模型基于动作和图像理解预测未来的图像,目的是学习环境的基本物理规律以改进动作生成。...
-
发布了文章 2个月前
VideoLLaMA3 – 阿里达摩院推出的多模态基础模型
VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合了先进的视觉编码器(如 SigLip)和强大的语言生成能力,能高效处理长视频序列,支持多语言的视频内容分析和...
-
发布了文章 2个月前
RynnEC – 阿里达摩院推出的世界理解模型
RynnEC是阿里巴巴达摩院推出的世界理解模型 (MLLM),专门用在具身认知任务。模型能从位置、功能、数量等11个维度全面解析场景中的物体,支持物体理解、空间理解以及视频目标分割等功能。...
没有更多内容







