阿里通软件
-
发布了文章 1个月前
阿里通义视频生成大模型即将上线,预约通道已开启
阿里巴巴旗下的通义实验室即将推出重磅新品——视频生成大模型!这个消息对于广大AI爱好者和内容创作者来说无疑是个好消息。目前,通义App频道和通义万相PC端已经上线了“视频生成”的预约入口,这意味着大家很快就能体验...
-
发布了文章 2个月前
阿里通义免费开放奥运AI大模型
阿里通义免费开放奥运AI大模型 7月31日,阿里通义宣布免费开放奥运AI大模型,具备奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以在通义APP免费使用。通过奥运专项强化训练,通义大模型已具备奥运专业知...
-
发布了文章 2个月前
Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具
Textoon 是阿里巴巴集团通义实验室推出的创新项目,首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型,能在一分钟内生成多样化且可交互的2D角色。...
-
发布了文章 2个月前
Qwen3 – 阿里通义开源的新一代混合推理模型系列
Qwen3 是阿里巴巴推出的新一代大型语言模型,Qwen3 支持“思考模式”和“非思考模式”两种工作方式,思考模式模型会逐步推理,经过深思熟虑后给出最终答案,适合复杂问题。非思考模式模型提供快速、近乎即时的响应,适用于简单问...
-
发布了文章 2个月前
Qwen2.5 – 阿里通义千问团队最新开源的最强AI大模型
Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规模数据集,包含多达 18 万亿个 token...
-
发布了文章 2个月前
QVQ – 阿里通义开源的视觉推理模型
QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。QVQ在MMMU评测中取...
-
发布了文章 2个月前
OmniAudio – 阿里通义推出的空间音频生成模型
OmniAudio 是阿里巴巴通义实验室语音团队推出的从360°视频生成空间音频(FOA)的技术。为虚拟现实和沉浸式娱乐提供更真实的音频体验。通过构建大规模数据集Sphere360,包含超过10.3万个视频片段,涵盖288种...
-
发布了文章 2个月前
MinMo – 阿里通义实验室推出的多模态语音交互大模型
MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,基于多阶段训练,在140万小时多样化语音数据和广泛语音任务上进行学习。...
-
发布了文章 2个月前
LHM – 阿里通义开源的单图生成可动画3D人体模型
LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何特征和2D图像特...
-
发布了文章 2个月前
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架
ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混合控制融合生成模型,能实现高保真度和自然度的视频生成,支持实时交互,...
-
发布了文章 2个月前
AnyStory – 阿里通义推出的高保真个性化文本到图像生成框架
AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架,实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编码阶段,AnyStory结合强大的ReferenceNet和CLI...
-
发布了文章 2个月前
ACE – 阿里通义实验室推出的全能图像生成和编辑模型
ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格式,能理解和执行自然语言指令,...
没有更多内容























