阿里通网络电话官方网站

baidu09_com

发布了文章 1个月前

阿里通义视频生成大模型即将上线，预约通道已开启

阿里巴巴旗下的通义实验室即将推出重磅新品——视频生成大模型！这个消息对于广大AI爱好者和内容创作者来说无疑是个好消息。目前，通义App频道和通义万相PC端已经上线了“视频生成”的预约入口，这意味着大家很快就能体验...

科技快讯

0 24 0
baidu09_com

发布了文章 2个月前

独家｜阿里通义实验室语音团队负责人鄢志杰离职，系达摩院十三位“扫地僧”成员

独家｜阿里通义实验室语音团队负责人鄢志杰离职，系达摩院十三位“扫地僧”成员 AI技术大牛出走大厂。Tech星球独家获悉，阿里通义实验室语音团队负责人鄢志杰已于近期离职，离职时间为2月15日，按照以前的P序列（原阿里内部...
AI人工智能

0 41 0
baidu09_com

发布了文章 2个月前

QVQ – 阿里通义开源的视觉推理模型

QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型，结合视觉理解和复杂问题解决能力，提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力，尤其在需要复杂分析思维的领域表现出色。QVQ在MMMU评测中取...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

MinMo – 阿里通义实验室推出的多模态语音交互大模型

MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型，专注于实现无缝语音交互。MinMo拥有约80亿参数，基于多阶段训练，在140万小时多样化语音数据和广泛语音任务上进行学习。...
AI工具

0 35 0
baidu09_com

发布了文章 2个月前

LLMDet – 阿里通义联合中山大学等机构推出的开放词汇目标检测模型

LLMDet是阿里巴巴集团通义实验室、中山大学计算机科学与工程学院、鹏城实验室等机构推出的开放词汇目标检测器，基于与大型语言模型（LLM）协同训练提升目标检测性能。LLMDet能收集包含图像、定位标签和详细图像级描述的数据集...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

LHM – 阿里通义开源的单图生成可动画3D人体模型

LHM（Large Animatable Human Reconstruction Model）是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构，融合3D几何特征和2D图像特...

AI工具

0 48 0
baidu09_com

发布了文章 2个月前

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni 是专注于人类中心场景的多模态大模型，视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入，能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预训练，采用动态权重调整机...
AI工具

0 34 0
baidu09_com

发布了文章 2个月前

ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架

ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入，生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混合控制融合生成模型，能实现高保真度和自然度的视频生成，支持实时交互，...
AI工具

0 35 0
baidu09_com

发布了文章 2个月前

AnyStory – 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架，实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编码阶段，AnyStory结合强大的ReferenceNet和CLI...
AI工具

0 35 0
baidu09_com

发布了文章 2个月前

Manus与阿里通义达成合作

据媒体报道，火爆异常的AI Agent新秀Manus和阿里云旗下大语言模型通义千问达成合作。双方将基于通义千问系列开源模型，在国产模型和算力平台上实现Manus的全部功能；双方将共同推动通用智能体技术的普惠化与商业化落地。...
人工智能

0 37 0

没有更多内容