AI工具
发布文章-
发布了文章 2个月前
Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型
Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面,例如在 LMArena 排行榜上位居第一。...
-
发布了文章 2个月前
Gemini 2.5 Pro (I O 版) – 谷歌推出的升级版多模态AI模型
Gemini 2.5 Pro (I/O 版 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...
-
发布了文章 2个月前
Gemini 2.5 Flash – 谷歌推出的最新 AI 推理模型
Gemini 2.5 Flash 是 Google 推出的高效、低延迟的 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时,引入思考能力。...
-
发布了文章 2个月前
Gemini 2.5 Flash Image – 谷歌推出的图像生成和编辑模型
Gemini 2.5 Flash Image(代号nano banana)是谷歌 AI Studio推出的先进图像生成与编辑模型。模型能保持角色在不同场景中的一致性,支持通过自然语言进行精准图像编辑,如模糊背景、消除污渍等。...
-
发布了文章 2个月前
Gemini 2.5 Deep Think – 谷歌推出的AI推理模型
Gemini 2.5 Deep Think 是谷歌推出的 AI 模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel Thinking)和强化学习...
-
发布了文章 2个月前
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型
Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1.5 Pro快两倍,关键性能指标超过 1.5 Pro...
-
发布了文章 2个月前
Gemini 2.0 Pro – 谷歌推出的高性能多模态AI模型
Gemini 2.0 Pro是Google推出的高性能实验版AI模型,专为编程性能和复杂提示处理优化。Gemini 2.0 Pro具备200万tokens的超大上下文窗口,能处理和分析海量信息,支持调用Google搜索和代码...
-
发布了文章 2个月前
Gemini 2.0 Flash – Google推出的多模态 AI 模型
Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯性。模型擅长将文本与图像结合,例如为故事生成连贯的插图...
-
发布了文章 2个月前
Gemini 2.0 Flash Thinking – 谷歌推出的最新推理模型,支持百万上下文展示思考路径
Gemini 2.0 Flash Thinking 是谷歌最新发布的推理增强型 AI 模型,专为复杂问题的高效推理和可解释性设计。在 Chatbot Arena 排行榜上表现卓越,超越了前代模型和其他竞争对手。模型升级的核心...
-
发布了文章 2个月前
GaussianEditor – 一种3D编辑算法,支持快速且精确地修改3D场景
GaussianEditor 是一种基于高斯飞溅(Gaussian Splatting)的3D编辑算法,支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅,提供了高度的编辑控制和稳定性,同时保持了渲染质量。...
-
发布了文章 2个月前
GaussianCity – 南洋理工大学 S-baidu09Lab 团队推出的 3D 城市生成框架
GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的 BEV-Point 表示方法,将场景的显存(VRAM)使用量保持在恒定水平,解决大规...
-
发布了文章 2个月前
GaussianAnything – 南洋理工 S-baidu09Lab 和上海 AI Lab 等推出的 3D 生成框架
GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D 生成框架。GaussianAnything 基于交互式的点云结构化潜空间和级联的流匹配模型,实现高质量、可扩展的 3D...
-
发布了文章 2个月前
GarDiff – AI虚拟试穿技术,生成高保真试穿图像保留服装细节
GarDiff是一种创新的虚拟试穿技术,通过使用CLIP和VAE编码来提取服装的外观先验,结合服装聚焦适配器和高频细节增强算法,生成高保真且细节丰富的试穿图像。能精确地对齐服装与人体姿态,保留服装的复杂图案和纹理,提供真实的...
-
发布了文章 2个月前
GameNGen – 谷歌推出的首个AI游戏引擎,生成实时可玩的游戏
GameNGen是谷歌推出的首个AI游戏引擎,能以每秒20帧的速度实时生成逼真的DOOM游戏画面,甚至让60%的玩家无法区分真假。GameNGen预示着游戏开发可能不再需要传统编程,大幅降低成本,同时为游戏创作带来无限可能。...
-
发布了文章 2个月前
GameGen-baidu09X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法
GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能,如创新角色、动态环境、复杂动作和多样化事件,支持用户用文本指令和键盘控制等多模...






























