首页 > 阿里通信百科

阿里通信百科

baidu09_com

发布了文章 2个月前

阿里通义上新PPT创作！PC端“效率”功能三合一，听读写一站搞定

阿里通义上新PPT创作！PC端“效率”功能三合一，听读写一站搞定这年头，哪有人上班不发疯的（doge）。...
AI人工智能

0 42 0
baidu09_com

发布了文章 2个月前

WebSailor – 阿里通义实验室开源的网络智能体

WebSailor 是阿里通义实验室开源的网络智能体，专注于复杂信息检索与推理任务。通过创新的数据合成方法（如 SailorFog-QA）和训练技术（如拒绝采样微调和 DUPO 算法），在高难度任务中表现出色，在 Brows...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

ThinkSound – 阿里通义推出的首个CoT音频生成模型

ThinkSound是阿里通义语音团队推出的首个CoT（链式思考）音频生成模型，用在视频配音，为每一帧画面生成专属匹配音效。模型引入CoT推理，解决传统技术难以捕捉画面动态细节和空间关系的问题，让AI像专业音效师一样逐步思考...

AI工具

0 41 0
baidu09_com

发布了文章 2个月前

Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具

Textoon 是阿里巴巴集团通义实验室推出的创新项目，首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型，能在一分钟内生成多样化且可交互的2D角色。...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

Qwen3 – 阿里通义开源的新一代混合推理模型系列

Qwen3 是阿里巴巴推出的新一代大型语言模型，Qwen3 支持“思考模式”和“非思考模式”两种工作方式，思考模式模型会逐步推理，经过深思熟虑后给出最终答案，适合复杂问题。非思考模式模型提供快速、近乎即时的响应，适用于简单问...
AI工具

0 47 0
baidu09_com

发布了文章 2个月前

Qwen2.5 – 阿里通义千问团队最新开源的最强AI大模型

Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型，具有多种参数规模的模型，包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规模数据集，包含多达 18 万亿个 token...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

QVQ – 阿里通义开源的视觉推理模型

QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型，结合视觉理解和复杂问题解决能力，提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力，尤其在需要复杂分析思维的领域表现出色。QVQ在MMMU评测中取...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

HumanOmniV2 – 阿里通义开源的多模态推理模型

HumanOmniV2 是阿里通义实验室开源的多模态推理模型。模型基于强制上下文总结机制、大模型驱动的多维度奖励体系及基于 GRPO 的优化训练方法，解决多模态推理中全局上下文理解不足和推理路径简单的问题。...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni 是专注于人类中心场景的多模态大模型，视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入，能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预训练，采用动态权重调整机...
AI工具

0 34 0
baidu09_com

发布了文章 2个月前

DiffuEraser – 阿里通义实验室推出的视频修复模型

DiffuEraser是基于稳定扩散模型的视频修复模型，以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结合先验信息来提供初始化和弱条件，有助于减少噪声伪影和抑制幻觉。为了在长序列推理期间提高时间一致性，Diffu...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架

ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入，生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混合控制融合生成模型，能实现高保真度和自然度的视频生成，支持实时交互，...
AI工具

0 35 0
baidu09_com

发布了文章 2个月前

CHRONOS – 阿里通义联合上海交大等推出时间线摘要生成新框架

CHRONOS是上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的，用在新闻时间线摘要生成的新型框架，基于迭代自问自答的方式，用大型语言模型（LLMs）构建开放域和封闭域的时间线。框架基于生成与新闻主题相...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

AnyStory – 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架，实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编码阶段，AnyStory结合强大的ReferenceNet和CLI...
AI工具

0 35 0
baidu09_com

发布了文章 2个月前

ACE++ – 阿里通义推出的升级版图像生成与编辑模型

ACE++是阿里巴巴通义实验室推出的先进的图像生成与编辑工具，通过指令化和上下文感知的内容填充技术，实现了高质量的图像创作和编辑功能。...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

ACE – 阿里通义实验室推出的全能图像生成和编辑模型

ACE（All-round Creator and Editor）是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元（LCU）和统一条件格式，能理解和执行自然语言指令，...
AI工具

0 37 0

1 2

关灯返回顶部