阿里达摩院最新成果
-
发布了文章 2个月前
VideoLLaMA3 – 阿里达摩院推出的多模态基础模型
VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合了先进的视觉编码器(如 SigLip)和强大的语言生成能力,能高效处理长视频序列,支持多语言的视频内容分析和...
-
发布了文章 2个月前
RynnRCP – 阿里达摩院开源的机器人上下文协议
RynnRCP 是阿里达摩院开源的机器人上下文协议(Robotics Context Protocol),能打通具身智能开发全流程。RynnRCP 包含 RCP 框架 和 RobotMotion 两大模块,前者提供机器人本体...
-
发布了文章 2个月前
FunClip – 阿里达摩院开源的AI自动视频剪辑工具
FunClip是阿里达摩院推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别。用户可以根据识别结果,选择文本片段或特定说话人,快速...
没有更多内容







