阿里sunfire开源
-
发布了文章 2个月前
阿里开源首个视觉推理模型,击败GPT-4o,网页一度404
阿里开源首个视觉推理模型,击败GPT-4o,网页一度404 过年关啦!阿里送上了今年最后一份礼物——“眼睛”模型QVQ,其中V代表视觉。它只需读取图像和指令,就可以开始思考。...
-
发布了文章 2个月前
Wan2.1 – 阿里开源的AI视频生成大模型
Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能卓越;1.3B参数的极速版能在消费级显卡上运...
-
发布了文章 2个月前
Qwen2 – 阿里云开源的新一代通义千问大模型
Qwen2是由阿里云通义千问团队开源的新一代大语言模型,该系列涵盖了从0.5B到72B不等的五个规模模型,在中文和英文基础上增加了27种语言的高质量数据,大幅提升了模型的自然语言理解、代码编写、数学解题和多语言处理能力。...
-
发布了文章 2个月前
MimicBrush – 阿里等开源的AI图像编辑融合框架
MimicBrush是由阿里巴巴、香港大学和蚂蚁集团的研究人员推出的AI图像编辑融合框架,允许用户通过简单的操作,在源图像上指定需要编辑的区域,并提供一个包含期望效果的参考图像进行图片编辑。...
-
发布了文章 2个月前
FunASR – 阿里开源的多功能语音识别工具包
FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR等多种功能。FunASR工具包支持工业级语音识别模型的训练和微...
-
发布了文章 2个月前
AgentScope – 阿里开源的多智能体开发平台
AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API和本地模型部署选项,覆盖聊天、图像合成、文本嵌入等多种...
没有更多内容

















