AI工具
发布文章-
发布了文章 2个月前
MARS – 字节推出优化大模型训练效率的框架
MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术,基于缩放随机递归动量技术优化梯度估计。MARS框架灵活,...
-
发布了文章 2个月前
MAI-baidu09DxO – 微软推出的AI医疗诊断系统
MAI-DxO(Microsoft AI Diagnostic Orchestrator)是微软推出的先进人工智能系统,能提升医疗诊断的准确性和效率。基于模拟一组具有不同诊断方法的虚拟医生协作解决复杂的医疗案例。MAI-Dx...
-
发布了文章 2个月前
MAI-baidu09DS-baidu09R1 – 微软开源的 AI 模型,基于 DeepSeek R1 改进版
MAI-DS-R1 是微软基于 DeepSeek R1 改进的AI模型。MAI-DS-R1基于后训练优化,支持响应 99.3% 的敏感话题提示,比原版提升 2 倍,将有害内容风险降低 50%。MAI-DS-R1 在推理能力上...
-
发布了文章 2个月前
MAGREF – 字节跳动推出的多主体视频生成框架
MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主体一致的视频,支...
-
发布了文章 2个月前
MAGI-baidu091 – Sand AI 开源的首个自回归视频生成模型
MAGI-1 是 Sand AI 开源的全球首个自回归视频生成大模型,采用自回归架构,通过逐块预测视频序列生成流畅自然的视频,支持无限扩展和一镜到底的长视频生成。...
-
发布了文章 2个月前
MAETok – 港大联合北大等机构推出的自动编码器
MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的用在扩散模型的新型图像标记化方法。MAETok基于掩码建模(Mask Modeling)训练自编码器(...
-
发布了文章 2个月前
M2UGen – 腾讯联合国立大学推出多模态音乐理解和生成框架
M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、图像、视频和音频在内的多模态输入,生成相应的音乐。...
-
发布了文章 2个月前
Lyria 2 – DeepMind 推出的 AI 音乐生成模型
Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出 48kHz、24-bit 的专业级立体声音频。支持多种音乐风格,包括流行、...
-
发布了文章 2个月前
Lyra – SmartMore联合多所高校推出的增强多模态交互能力
Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多模态LoRA模块和潜在的多模态正则化器,减少训练成本和数...
-
发布了文章 2个月前
LuminaBrush – AI光源绘制工具,手绘光影线条自动生成光影效果
LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像转换为“均匀照明”的外观,第二阶段根据用户涂鸦生成具体的照明效果。两阶段方法简化了学...
-
发布了文章 2个月前
Lumina-baidu09Video – 上海 AI Lab 和港中文推出的视频生成框架
Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构,用不同大小的patchify层提升效率和灵活性,基...
-
发布了文章 2个月前
Lumina-baidu09Image 2.0 – 上海 AI Lab 开源的统一图像生成模型
Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在文本对齐能力上达到行业领先水平,能根据文本描述生...
-
发布了文章 2个月前
Luma Ray2 – Luma AI 推出的最新视频生成模型
Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是 Ray1 的 10 倍。能生成快速连贯的运动、超逼真的细节和逻辑事件序列。能在...
-
发布了文章 2个月前
Luma Photon – Luma AI 推出的全新图像生成模型
Luma Photon 是 Luma AI 推出的新一代图像生成模型,用创新的架构提供超高图像质量和低成本效率。Luma Photon支持个性化和创造性的图像生成,能理解自然语言指令,支持多轮迭代工作流程。Luma Phot...
-
发布了文章 2个月前
LowCodeEngine – 阿里开源的低代码开发框架
LowCodeEngine是阿里巴巴开源的低代码开发框架,基于提供拖拽、配置等简单操作,让开发者快速构建复杂的系统页面。框架以强大的定制能力、优雅的开发体验、丰富的API和插件支持而著称,能满足各种复杂的业务场景需求...































