AI工具
发布文章-
发布了文章 2个月前
JoyCaption – 开源的图像提示词生成工具
JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向,最小化过滤理解世界的各个方面,但不支持非法内容。JoyCaption 的开发是为填补社区在...
-
发布了文章 2个月前
JoyAgent-baidu09JDGenie – 京东开源的通用多智能体系统
JoyAgent-JDGenie是京东开源的首个高完成度轻量化通用多智能体产品,作为完整的端到端智能体系统,无需二次开发能直接使用,支持多种任务处理,如生成报告、分析数据等。...
-
发布了文章 2个月前
Joy industrial – 京东工业推出以供应链为核心的工业大模型
Joy Industrial是京东工业推出的行业首个供应链为核心的工业大模型。模型针对工业场景,依托京东工业在工业数智供应链领域的经验积累和数据沉淀,基于“工业大模型+供应链场景应用”双引擎,构建全栈产品矩阵。...
-
发布了文章 2个月前
Jodi – 中国科学院推出的视觉理解与生成统一模型
Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,将视觉生成与理解统一起来。...
-
发布了文章 2个月前
Jina-baidu09embeddings-baidu09v3 – 专为多语言和长文本上下文检索设计的文本嵌入模型
Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型,专为多语言数据处理和长文本上下文检索任务设计。模型拥有 5.7 亿参数,支持长达 8192 个 token 的文本处理。...
-
发布了文章 2个月前
Jina Reader – AI 网页解析工具,一键将网页内容转为适配LLM的文本格式
Jina Reader 是 Jina AI 推出的开源工具,能将互联网上的 HTML 网页内容转换为适合大型语言模型(LLMs)处理的纯文本格式。用户只需在网址前添加特定前缀,即可快速提取网页的主要内容,并用结构化文本形式输...
-
发布了文章 2个月前
JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架
JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略,提升模型在不同任务上的性能...
-
发布了文章 2个月前
Janus-baidu09Pro – DeepSeek 开源的统一多模态模型
Janus-Pro是 DeepSeek 推出的开源AI模型,支持图像理解和图像生成,提供 1B 和 7B 两种规模,适配多元应用场景。通过改进的训练策略、扩展的数据集和更大规模的模型,显著提升了文本到图像的生成能力和指令跟随...
-
发布了文章 2个月前
Janus – DeepSeek推出的自回归框架,统一多模态理解和生成任务
Janus是一个由DeepSeek AI推出的自回归框架,旨在统一多模态理解和生成任务。将视觉编码分离成不同的路径解决以往方法的局限性,且用单一的变换器架构进行处理。减轻视觉编码器在理解和生成任务中的角色冲突,提高框架的灵活...
-
发布了文章 2个月前
Jamba – AI21开源的首个基于Mamba架构的大模型
Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构...
-
发布了文章 2个月前
Jaaz – 开源的AI设计Agent,本地免费Lovart平替项目
Jaaz 是开源的AI设计Agent,本地免费 Lovart 平替项目。具备强大的 AI 设计能力,能智能生成设计提示,批量生成图像、海报、故事板等。...
-
发布了文章 2个月前
Ivy-baidu09VL – AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型
Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型,专为移动端和边缘设备设计。模型拥有3B参数量,相较于其他多模态大模型,显著降低计算资源需求,能在AI眼镜、智能手机等资源受限设备...
-
发布了文章 2个月前
ItiNera – 港大与MIT联合推出的AI城市行程规划(OUIP)系统
ItiNera 是港大和MIT联合开发的智能城市行程规划系统。基于大型语言模型(LLM)和空间优化技术,根据用户的个性化需求,如情侣酒吧、二次元圣地等,一键生成Citywalk路线。系统包含五大模块:用户兴趣点数据库构建、请...
-
发布了文章 2个月前
IterComp – 清北、牛津等多所高校联合推出的文本到图像生成框架
IterComp是一个由清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学的研究人员联合推出的文本到图像生成框架。基于迭代反馈学习机制,聚合多个扩散模型的组合生成偏好,全面提升模型在处理复杂组合...
-
发布了文章 2个月前
Inverse Painting – 华盛顿大学推出逆向重现绘画过程的AI技术
Inverse Painting 是一种AI技术,由华盛顿大学的研究人员推出,能逆向重现绘画过程。通过分析艺术家的绘画视频,学习绘画技巧和顺序,然后生成一系列绘画指令,逐步更新画布,模拟艺术家的创作过程。过程包括学习绘画过程...






























