AI工具
发布文章-
发布了文章 2个月前
MaskGCT – 趣丸科技联合香港中文大学推出的语音合成大模型
MaskGCT是趣丸科技与香港中文大学(深圳)合作推出的语音合成大模型,基于掩码生成模型与语音表征解耦编码的技术,实现在声音克隆、跨语种合成、语音控制等任务上的显著效果。模型在多个TTS基准数据集上达到行业领先的水平,某些性...
-
发布了文章 2个月前
Markdown-baidu09to-baidu09Image – 开源的在线 Markdown 转海报编辑器
Markdown-to-Image是开源的Markdown 转为海报的编辑器,作为React组件能将Markdown文本内容转换成图像,适用于创建社交媒体帖子、海报和其他视觉内容。工具支持多种输出格式,包括海报、图片、引用、...
-
发布了文章 2个月前
MarkItDown – 微软开源的多功能、多格式文档转Markdown工具
MarkItDown是微软开源的多功能文档处理工具,能将PDF、PPT、Word、Excel、图像、音频、HTML等多种格式的文件转换成Markdown格式。支持OCR文字识别、语音转文字和元数据提取,适用于内容索引、数据挖...
-
发布了文章 2个月前
Marco – 阿里推出的商用翻译大模型,支持15个语种
Marco是阿里国际最新推出的大规模商用翻译大模型,支持15种全球主流语种,包括中、英、日、韩、西、法等。在BLEU评测指标上超越Google翻译、DeepL、GPT-4等竞争对手,提供基于语境的精准翻译,避免字面意思造成的...
-
发布了文章 2个月前
MarS – 微软亚洲研究院开源的金融市场模拟预测引擎
MARS(Market Simulation)是微软亚洲研究院推出的金融市场模拟预测引擎,基于生成型基础模型LMM(Large Market Model)模拟金融市场中的订单流和市场动态。MARS能创建现实、互动和可控的市场...
-
发布了文章 2个月前
MarDini – Meta联合KAUST推出的视频生成扩散模型
MarDini是新型的视频扩散模型,融合掩码自回归(MAR)和扩散模型(DM)的优势,用在大规模视频生成。模型能处理任意数量和位置的掩码帧,支持视频插值、图像到视频生成及视频扩展等多种任务。MarDini将大部分计算资源分配...
-
发布了文章 2个月前
MangaNinja – 基于参考图像的线稿着色技术
MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战,包括极端姿势和多参考图像的协调,实现高质量的互动上...
-
发布了文章 2个月前
Manga Image Translator – 开源漫画图片文字翻译工具,多语言翻译无缝嵌入原图
Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片中的文字。Manga Image Translator基于OCR技术识别文本,结合机器翻译将文字转换成目标语言。工具支持多种语言,...
-
发布了文章 2个月前
MakeAnything – 新加坡国立大学开源的一致性图片序列生成框架
MakeAnything 是新加坡国立大学 Show Lab团队推出的基于扩散变换器(Diffusion Transformer)的多领域程序性序列生成框架,基于文本描述或图像输入生成高质量的分步教程。MakeAnythin...
-
发布了文章 2个月前
Make-baidu09It-baidu09Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产
Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态,无论其形状和姿势如何。框架基于生成高质量的混合权重、骨骼和姿势变换,...
-
发布了文章 2个月前
Make-baidu09A-baidu09Character:阿里开源的AI 3D数字人生成框架
Make-A-Character(简称Mach)是一个由阿里巴巴集团智能计算研究院开发的一个人工智能3D数字人生成框架,旨在通过文本描述快速创建逼真的3D角色。该系统特别适用于满足人工智能代理和元宇宙中对个性化和富有表现力的...
-
发布了文章 2个月前
Mahilo – AI多智能体框架,支持创建与人类互动的多智能体系统
Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督和控制。Mahilo 提供强大的组织级策略管理功能,确保所有智能...
-
发布了文章 2个月前
Magnitude – 开源 AI Agent 驱动的端到端测试框架
Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例,用强大的推理代理规划和调整测试流程,基于快速的视觉代理执行测试。Magnitude 支持本地运行和 CI/...
-
发布了文章 2个月前
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型
Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,覆盖数字和物理环境。Magma基于大规模的视觉-语言数据和动作数据进行预...
-
发布了文章 2个月前
Magistral – Mistral AI推出的推理模型系列
Magistral 是 Mistral AI 推出的推理模型,核心聚焦在透明、多语言和特定领域的推理能力。模型包含 Magistral Small(开源版)和 Magistral Medium(企业版), Magistral...





























