AI工具
发布文章-
发布了文章 2个月前
RWKV-baidu097 – RWKV系列的最新大模型架构版本,有强大的上下文学习能力
RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵活的状态演化能力,能在相同算力消耗下解决attention无法解决的问题。...
-
发布了文章 2个月前
RTranslator – 开源的离线、实时、多语言翻译应用程序
RTranslator 是一款开源、免费、离线实时翻译应用程序,专为 Android 设备设计。基于先进的AI技术,包括 Meta 的 NLLB 翻译模型和 OpenAI 的 Whisper 语音识别,实现高质量的多语言翻译...
-
发布了文章 2个月前
RSIDiff – 基于合成数据提升图像生成质量的递归自训练框架
RSIDiff 是用于提升文本到图像扩散模型性能的递归自训练(RSI)框架。通过迭代优化模型,基于模型自身生成的数据进行训练,解决传统自训练中常见的训练崩溃问题。...
-
发布了文章 2个月前
RMBG-baidu092.0 – 开源的图像背景移除模型,支持各类图像高精度背景移除
RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA(State of the Art,即当前最佳)水平。RMBG-2.0在性能上超越前代版本,从1.4版...
-
发布了文章 2个月前
RLCM – 康奈尔大学推出的优化文本到图像一致性模型的框架
RLCM(Reinforcement Learning for Consistency Model)是康奈尔大学推出用在优化文本到图像生成模型的框架,基于强化学习方法微调一致性模型适应特定任务的奖励函数。将一致性模型的多步推...
-
发布了文章 2个月前
RF-baidu09DETR – Roboflow推出的实时目标检测模型
RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值(mAP)的实时模型,性能优于现有的目标检测模型。RF-DETR结合LW-DETR与预训练的DINOv2主干...
-
发布了文章 2个月前
REEF – 上海AI Lab联合中科院等高校推出用于大模型的指纹识别技术
REEF(Representation Encoding Fingerprints)是用于大型语言模型(LLM)的指纹识别技术。通过在模型训练过程中嵌入特定的编码信息,为每个模型生成一个唯一的“指纹”,这个“指纹”包含了模型...
-
发布了文章 2个月前
RDT – 清华开源的双臂机器人扩散基础模型
RDT(Robotics Diffusion Transformer)是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能在无需人类操控的情况下,自主完成复杂任务,如调酒...
-
发布了文章 2个月前
RD-baidu09Agent – 微软亚洲研究院推出开源的自动化研究与开发工具
RD-Agent是一个开源的自动化研究与开发(R&D)工具,由微软亚洲研究院推出。基于AI技术推动数据驱动的AI研发过程,专注于简化模型和数据的开发。RD-Agent的核心在于自动化提出新想法和实施整个过程,旨在提高研发效率...
-
发布了文章 2个月前
RAIN – 视频流制作实时动画生成和真人表情移植解决方案
RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于消费级硬件,如单个RTX 4090 GPU,实现无限视频流的实时动画化。核心在于高效地计算不同...
-
发布了文章 2个月前
RAGFlow – 基于OCR和文档解析的下一代 RAG 引擎
RAGFlow 是开源的 RAG(Retrieval-Augmented Generation)引擎,拥有深入理解文档并增强生成能力,是基于OCR和文档解析的下一代 RAG 引擎。RAGFlow通过集成自动化工作流程、代码审...
-
发布了文章 2个月前
RAGEN – 训练大模型推理 Agent 的开源强化学习框架
RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过...
-
发布了文章 2个月前
RAG-baidu09FiT – 英特尔实验室推出用于开发、增强大模型的开源RAG框架
RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。RAG-FiT基于模块化设计,支持数据创建、训练...
-
发布了文章 2个月前
RAG-baidu09Diffusion – 南京大学推出的区域感知文本到图像生成方法
RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实现对图像中各个区域的精确控制和细节优化。RAG-Diffusion支持图像重绘功能,用户在保持其他区域不变的情况...
-
发布了文章 2个月前
RAG-baidu09Anything – 港大开源的多模态RAG系统
RAG-Anything是香港大学数据智能实验室推出的开源多模态RAG系统。系统支持处理包含文本、图像、表格和公式的复杂文档,提供从文档摄取到智能查询的端到端解决方案。系统基于多模态知识图谱、灵活的解析架构和混合检索机制,显...






























