AI工具
发布文章-
发布了文章 2个月前
GenMAC – 港大、清华联合微软推出文本到视频生成的多代理协作框架
GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段,在生成与重新设计之间建立迭代循环,逐步验证和优化视频内容。...
-
发布了文章 2个月前
GenCast – 谷歌DeepMind推出的AI气象预测模型
GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统ENS,尤其在极端天气事件的预测上表现突出。与...
-
发布了文章 2个月前
Gen2Act – 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略
Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学共同推出的一种机器人操作策略,基于预测网络数据中的运动信息来生成人类视频,并将视频用在引导机器人执行新任务。策略基于大量可用的网络视频数据,避免直接生成机器人视频的复杂性。...
-
发布了文章 2个月前
Gen CLI – AI命令行编程助手,Gemini-baidu09CLI平替项目
Gen-CLI 是基于开源 Gemini-CLI ,依托硅基流动 SiliconCloud 平台 API 开发的命令行AI编程工具。Gen-CLI 为国内开发者提供类似 Gemini-CLI 的高效编程能力。Gen-CLI...
-
发布了文章 2个月前
Gemma 3n – 谷歌推出的端侧多模态AI模型
Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型。基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。模型参数量分别为 5B 和 8B,内存占用仅相当于 2...
-
发布了文章 2个月前
Gemma 3 – 谷歌最新推出的开源多模态 AI 模型
Gemma 3 是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过 35 种语言,具备分析文本、图像及短视频的能力,提供四种不同尺寸的模型(1B、4B、12B 和 27B),满足不同...
-
发布了文章 2个月前
Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版
Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降低内存需求的同时,保持了高...
-
发布了文章 2个月前
Gemma 2 – 谷歌DeepMind推出的新一代开源人工智能模型
Gemma 2是谷歌DeepMind推出的新一代开源人工智能模型,包含90亿和270亿参数版本。该模型以卓越的性能、高效的推理速度和广泛的硬件兼容性为特点,能够与参数量更大的模型相媲美。...
-
发布了文章 2个月前
Gemini Robotics – 谷歌 DeepMind 推出的具身智能大模型
Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Robotics-ER 和 Gemini Ro...
-
发布了文章 2个月前
Gemini Robotics On-baidu09Device – 谷歌推出的首个本地具身智能模型
Gemini Robotics On-Device是谷歌DeepMind推出的首个可在机器人本地运行的视觉-语言-动作(VLA)模型。模型具备强大的离线操作能力,能遵循自然语言指令完成精细任务,如拉开袋子、叠衣服等。模型支持...
-
发布了文章 2个月前
Gemini Fullstack LangGraph Quickstart – 谷歌DeepMind开源的全栈AI研究助手
Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目,帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。...
-
发布了文章 2个月前
Gemini Embedding – 谷歌推出的文本嵌入模型
Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练,具备强大的语言理解能力,支持超...
-
发布了文章 2个月前
Gemini Diffusion – 谷歌推出的文本扩散模型
Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion在文本生成任务中表现出色,具备快速响应、生成更...
-
发布了文章 2个月前
Gemini Coder – AI 应用生成工具,文本描述实时生成代码和预览
Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 应用。Gemini Coder基于简单的描述,结合 Sandpack 实现...
-
发布了文章 2个月前
Gemini CLI – 谷歌开源的AI编程工具,免费用Gemini 2.5 Pro模型
Gemini CLI 是谷歌开源的终端AI编程工具,免费用Gemini 2.5 Pro模型。Gemini CLI提供强大 AI 功能,如代码理解、文件操作、命令执行及动态排查问题,助力开发者高效编写代码、修复错误、构建功能和...































