AI工具
发布文章-
发布了文章 2个月前
LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型
LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容,同步生成自然流畅的语音或文字解说。...
-
发布了文章 2个月前
LitServe – 基于FastAPI的高性能AI模型部署引擎
LitServe是基于FastAPI的高性能AI模型部署引擎,专为企业级AI服务设计。支持批处理、流式处理和GPU自动扩展,简化了模型部署流程。...
-
发布了文章 2个月前
Liquid – 华中科技、字节、港大联合推出的统一多模态生成框架
Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token,与文本token共享同一词汇空间,让大型语言模型(LLM)无需修改结构实现视觉生成与理解。...
-
发布了文章 2个月前
Lipsync-baidu092 – Sync Labs 推出的首个零-baidu09shot 嘴型同步模型
Lipsync-2 是 Sync Labs 推出的全球首个零-shot 嘴型同步模型。无需针对特定演讲者进行预训练,能即时学习并生成符合独特说话风格的嘴型同步效果。...
-
发布了文章 2个月前
Linly-baidu09Dubbing – 开源AI视频工具,支持配音、翻译、对口型
Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge TTS、XTTS 和 CosyVoice...
-
发布了文章 2个月前
Lingua – Meta推出的轻量级独立代码库
Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和数据集。Lingua 专注于端到端训练、推理和评估,提...
-
发布了文章 2个月前
Lingshu – 阿里推出的医疗多模态语言模型
Lingshu是阿里巴巴达摩院推出的专注于医学领域的多模态大型语言模型。模型支持超过12种医学成像模态,包括X光、CT扫描、MRI等,在多模态问答、文本问答及医学报告生成等任务上展现出卓越的性能。Lingshu基于多阶段训练...
-
发布了文章 2个月前
Lingo – 西湖心辰推出的端到端语音大模型,媲美GPT-baidu094o
Lingo 是西湖心辰推出的国内首个端到端语音大模型,在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。...
-
发布了文章 2个月前
LineArt – 吉林大学等机构推出的设计绘图外观迁移框架
LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的,无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征转移到详细的设计图纸上,辅助设计和艺术创作。LineArt基于模拟人类层次化的视觉认知过程,整合艺术...
-
发布了文章 2个月前
LinGen – Meta联合普林斯顿大学推出的文本到视频生成框架
LinGen是普林斯顿大学和Meta共同推出的新型文本到视频生成框架。框架基于线性复杂度的MATE模块(包含MA-branch和TE-branch),替换传统Diffusion Transformers中的二次复杂度的自注意...
-
发布了文章 2个月前
LinFusion – 新加坡国立推出图像生成模型,单GPU一分钟生成16K图像
LinFusion 是新加坡国立大学研究团队开发的一种创新图像生成模型,基于线性注意力机制来处理高分辨率图像生成任务。使模型在处理大量像素时的计算复杂度保持线性,显著提高生成效率。...
-
发布了文章 2个月前
LightRAG – 香港大学推出的开源检索增强生成系统
LightRAG是由香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation, RAG)系统,基于整合图结构索引和双层检索机制,提升大型语言模型在信息检索中的准确性和效率。系统能捕...
-
发布了文章 2个月前
LightLab – 谷歌等机构推出的图像光源控制模型
LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。支持用户调整光源的强度和颜色,插入虚拟光源,及改变环境光的强度。基于结合少量真实照片对和大量合成渲染图像进行训练,...
-
发布了文章 2个月前
LightEval – Hugging Face推出的轻量级AI大模型评估工具
LightEval是Hugging Face推出的一款轻量级AI评估工具,专门用于评估大型语言模型(LLMs)。LightEval支持多任务处理和复杂模型配置,能在多种硬件上运行,包括CPU、GPU和TPU。用户可以通过简单...
-
发布了文章 2个月前
Light-baidu09R1 – 360智脑开源的长思维链推理模型
Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两阶段课程学习(SFT+DPO)训练,实现从零超...






























