AI工具
发布文章-
发布了文章 2个月前
YuE – 港科大联合 M-baidu09A-baidu09P 推出的开源AI音乐生成模型
YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为完整的歌曲,支持多种音乐风格,包括流行、金属、爵士、嘻哈等,并且支持英语、中文、日语和韩语等...
-
发布了文章 2个月前
Youtu-baidu09agent – 腾讯优图推出的开源智能体框架
Youtu-agent 是腾讯优图实验室推出的开源智能体框架,用在构建、运行和评估自主智能体。框架基于开源模型DeepSeek-V3实现领先性能,支持多种模型 API 和工具集成,具备强大的智能体能力,如数据分析、文件处理和...
-
发布了文章 2个月前
Yi-baidu09Lightning – 零一万物最新推出的高性能高速度旗舰模型
Yi-Lightning 是零一万物公司最新发布的旗舰模型,在国际权威盲测榜单 LMSYS 上取得了显著成绩,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5...
-
发布了文章 2个月前
Yi-baidu09Coder – 零一万物开源的AI编程助手模型,提供1.5B和9B两种参数
Yi-Coder是零一万物推出的开源编程助手系列模型,专为提升代码生成、理解、调试和补全等任务的效率而设计。Yi-Coder系列模型包含1.5B和9B两种参数规模的版本,支持52种主流编程语言,能处理长达128K token...
-
发布了文章 2个月前
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息
YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能,让用户快速定位到特定频道视频中的相关信息,且提供精准的时...
-
发布了文章 2个月前
YOLOv9 – 新一代高效的实时目标检测系统
YOLOv9是一个由台北中研院和台北科技大学等机构的研究团队推出的新一代先进的目标检测系统,是YOLO(You Only Look Once)算法系列的最新版本。YOLOv9在前代版本的基础上进行了改进,旨在解决深度学习中信...
-
发布了文章 2个月前
YAYI-baidu09Ultra – 中科闻歌推出的混合专家模型
YAYI-Ultra 是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领域的专家组合,能缓解垂直领域迁移中的“跷跷板”现象。...
-
发布了文章 2个月前
Xiaomi MiMo – 小米开源的首个推理大模型
Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采用创新的强化学习算法,显著提升数学推理和代码生成能力。...
-
发布了文章 2个月前
Xianyu AutoAgent – AI闲鱼客服机器人,支持多专家协同决策
Xianyu AutoAgent 是为闲鱼平台设计的智能客服机器人系统。支持实现7×24小时自动化值守,多专家协同决策、智能议价及上下文感知对话。基于上下文感知技术,管理轻量级对话记忆,将完整对话历史作为输入,实现更自然的交...
-
发布了文章 2个月前
XiYan-baidu09SQL – 阿里推出文本到SQL的多生成器集成框架
XiYan-SQL是阿里巴巴推出的自然语言到SQL(NL2SQL)框架,基于多生成器集成策略,结合提示工程和监督微调,提升SQL查询生成质量。XiYan-SQL引入M-Schema半结构化架构表示,增强对数据库结构的理解,包...
-
发布了文章 2个月前
XVerse – 字节跳动推出的多主体控制图像生成模型
XVerse是字节跳动智能创作团队推出的新型多主体控制图像生成模型。模型在文本到图像生成领域实现对多个主体身份和语义属性(如姿势、风格、光照)的精细控制,同时保持生成图像的高质量和一致性。...
-
发布了文章 2个月前
XVERSE-baidu09MoE-baidu09A36B – 元象开源的国内最大MoE模型,推理性能提升100%
XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B参数的大模型相媲美,实现跨级的...
-
发布了文章 2个月前
XMusic – 腾讯多媒体实验室自主研发的AI通用作曲框架
XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容,XMusic能生成情绪、曲风、节奏可控的高质量音乐。基于自研的多模态和序列建模技术,可将提示词内容解析至符号音乐要...
-
发布了文章 2个月前
XGrammar – 陈天奇团队推出的LLM结构化生成引擎
XGrammar是由陈天奇团队推出的开源软件库,能为大型语言模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法(CFG)定义结构,支持递归组合以表示复杂结构,适合生成JSON、SQL等格式数据。XG...
-
发布了文章 2个月前
XBai o4 – 开源的并行推理模型,高质量的推理轨迹
XBai o4是开源的大语言模型,基于“反射生成形式”训练,结合长CoT强化学习和过程奖励学习,在复杂推理能力上表现出色,中等模式下已超越OpenAI-o3-mini。...