AI工具
发布文章-
发布了文章 2个月前
LosslessCut – 开源的AI视频编辑工具,无损精准剪辑与合并音视频文件
LosslessCut是一款开源的视频编辑工具,用于快速且无损地剪切和合并视频和音频文件。基于强大的FFmpeg库构建,提供一个直观的图形用户界面,用户轻松地进行剪辑、合并、转封装及添加字幕和音乐等操作。...
-
发布了文章 2个月前
Loopy – 字节跳动推出的音频驱动的AI视频生成模型
Loopy是字节跳动推出的音频驱动的AI视频生成模型,用户可以让一张静态照片动起来,照片中的人物根据给定的音频文件进行面部表情和头部动作的同步,生成逼真的动态视频。Loopy基于先进的扩散模型技术,无需额外的空间信号或条件,...
-
发布了文章 2个月前
Loong – 港大和字节联合推出的长视频生成模型
Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM),将文本和视频信息整合为统一序列,用渐进式短到长训练方案与损失重新加...
-
发布了文章 2个月前
LongWriter – 清华联合智谱AI推出的长文本生成模型
...
-
发布了文章 2个月前
LongVU – Meta AI开源的长视频理解模型
LongVU是Meta AI团队推出的长视频理解模型,基于时空自适应压缩机制。解决处理长视频时受限于大型语言模型(LLM)上下文大小的挑战。LongVU基于跨模态查询和帧间依赖性,LongVU能在减少视频标记数量的同时,保留...
-
发布了文章 2个月前
LongVILA – 面向长视频理解的视觉语言AI模型
LongVILA是一个面向长视频理解的视觉语言AI模型,由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校共同开发。通过算法和系统的共同设计,实现了在大量GPU上进行超长上下文长度训练的能力,无需梯度检查点。LongVI...
-
发布了文章 2个月前
LongReward – 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法
LongReward是清华大学、中国科学院、智谱AI联合推出的,基于AI反馈改进长文本大型语言模型(LLMs)性能的方法。LongReward从有用性、逻辑性、忠实性和完整性四个维度为模型响应打分,提供奖励信号,强化学习的方...
-
发布了文章 2个月前
LongRAG – 智谱联合清华和中科院推出的双视角鲁棒检索框架
LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器四个组件,有效解决长文本问...
-
发布了文章 2个月前
LongPort MCP – 长桥集团推出的证券业首个券商MCP
LongPort MCP(Model Context Protocol)是长桥集团推出的证券行业首个券商MCP。基于 LongPort MCP,AI 能快速调用证券行情数据、执行股票交易、管理资产组合等核心金融服务。...
-
发布了文章 2个月前
LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型
LongLLaVA是多模态大型语言模型(MLLM),基于混合架构结合Mamba和Transformer模块,能高效处理大量图像,特别擅长视频理解和高分辨率图像分析。LongLLaVA在单个A100 80GB GPU上能处理近...
-
发布了文章 2个月前
LongDocURL – 中科院联合淘天集团推出的多模态长文档理解基准数据集
LongDocURL是中国科学院自动化研究所和阿里巴巴淘宝天猫集团联合发布的多模态长文档理解基准数据集。专注于评估模型在处理长文档、复杂元素和多样化任务中的理解、推理和定位能力。...
-
发布了文章 2个月前
LongCite – 清华推出的开源模型,提升LLMs的精准引用减少幻觉
ongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准...
-
发布了文章 2个月前
LongAlign – 港大推出的提升文本到图像扩散模型处理长文本对齐方法
LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型的输入限制。同时引入分解偏好优化,基于区分偏好模型...
-
发布了文章 2个月前
Long-baidu09VITA – 腾讯优图联合南大、厦大开源的多模态模型
Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在短文本任务中表现出色。Long-VITA基于分阶段训练,逐步扩展视觉和语言的上下文理解能力,支持图像、视...
-
发布了文章 2个月前
LogoCreator – 开源 AI Logo生成器,几秒内创建专业级定制化商标
LogoCreator是开源的logo生成器,基于Together AI提供的Flux Pro 1.1技术快速创建专业风格的logo。项目用Next.js和TypeScript构建应用框架,Shadcn和Tailwind C...





























