AI工具
发布文章-
发布了文章 2个月前
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构
UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 MoE 提升了2-6倍,成本最高可降低83%。...
-
发布了文章 2个月前
URO-baidu09Bench – AI基准测试工具,专为端到端语音对话模型设计
URO-Bench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务,全面评估语音对话模型的性能。...
-
发布了文章 2个月前
URM – 阿里妈妈推出的世界知识大模型
URM(Universal Recommendation Model)是阿里妈妈推出的世界知识大模型,基于知识注入和信息对齐,将LLM的通用知识与电商领域的专业知识相结合,解决传统LLM在电商推荐场景中表现欠佳的问题。...
-
发布了文章 2个月前
UNO – 字节跳动推出的创新AI图像生成框架
UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变换器生成高一致性的多主体数据,采用渐进...
-
发布了文章 2个月前
UI-baidu09TARS – 字节跳动推出的开源原生 GUI 代理模型
UI-TARS 是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力,能实时理解动态界面,通过多模态输入(如文本、图像)执行复...
-
发布了文章 2个月前
UFO² – 微软推出的 Windows 桌面 Agent 操作系统
UFO² 是微软推出的面向 Windows 桌面的多Agent操作系统(AgentOS),基于深度系统集成和自然语言交互实现复杂桌面任务的自动化。UFO²基于中央 HostAgent 分解任务协调多个应用专用的 AppAge...
-
发布了文章 2个月前
TÜLU 3 – Ai2 推出的系列开源指令遵循模型
TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本,提供了详细的后训练技术报告,公开数据、评估...
-
发布了文章 2个月前
TxGemma – 谷歌推出的通用医学治疗大模型
TxGemma 是谷歌推出的用于药物发现的通用人工智能模型,通过 AI 技术加速药物研发进程。基于 Google 的 Gemma 框架开发,能理解常规文本以及化学物质、分子和蛋白质等治疗实体的结构。研究人员可以通过 TxGe...
-
发布了文章 2个月前
Twocast – AI双人播客生成器,模拟真实双人对话形式
Twocast是AI驱动的双人播客生成器,支持生成双人对话形式的播客内容。生成器支持多语言、多音色,且能基于主题、链接、文档等多种方式快速生成3-5分钟的播客。...
-
发布了文章 2个月前
TurboSeek – AI驱动的开源的智能搜索引擎
TurboSeek是一个开源的AI搜索引擎,由Together.ai提供技术支持。基于现代化的技术栈,包括Next.js、Tailwind、Bing搜索API及先进的语言模型Mixtral 8x7B和Llama-3,为用户提...
-
发布了文章 2个月前
TurboEdit – Adobe推出的AI即时图像编辑模型
TurboEdit是Adobe Research 推出的AI即时图像编辑模型。通过编码器迭代反演和基于文本的精细控制,能够在几步内实现对图像的精确编辑。利用详细的文本提示,通过修改提示中的单一属性,实现图像中相应属性的精确改...
-
发布了文章 2个月前
TryOffDiff – AI虚拟试穿技术,单张穿着者图片生成标准化服装图像
TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照片生成标准化的服装图像。与传统的Virtual Try-On技术不同,TryOffDiff的目标是从参考图...
-
发布了文章 2个月前
TryOffAnyone – 将模特穿着服装的图像还原成平铺商品图的 AI 工具
TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diffusion Models技术,自动识别并提取照片中的服装区域,然后将其转换为专业平铺效果。对于电商平台来说非常...
-
发布了文章 2个月前
TripoSR – Stability AI 联合 VAST 开源的 3D 生成模型
TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了大型重建模型(LRM)的原理,对数据处理、模型...
-
发布了文章 2个月前
TripoSG – VAST AI 开源的高保真 3D 形状合成技术
TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成技术, 通过大规模修正流变换器架构、混合监督训练策略以及高质量数据集,实现了...






























