AI工具
发布文章-
发布了文章 2个月前
Glass – 开源AI桌面助手,实时捕捉屏幕内容和音频识别
Glass 是Pickle 团队推出的开源隐形 AI 桌面助手。Glass能在后台实时捕捉屏幕内容和音频,将其转化为结构化知识。Glass核心功能包括实时会议记录、自动摘要生成、上下文理解及实时问答。...
-
发布了文章 2个月前
GitMCP – 开源MCP服务器,可将GitHub仓库转为实时文档中心
GitMCP 是开源的远程 Model Context Protocol (MCP 服务器,能将 GitHub 仓库(包括代码库和 GitHub 页面)转变为实时文档中心,让 AI 工具(如 Cursor)直接访问最新文档...
-
发布了文章 2个月前
GitHub Spark – GitHub推出的AI编程工具,零代码开发应用
GitHub Spark是GitHub推出的AI编程工具,支持GPT-4o、Claude Sonnet 3.5等四款编程模型。用户无需任何代码和部署环境,基于自然语言描述需求,能在桌面或移动端快速开发微应用程序。Spark能...
-
发布了文章 2个月前
GitHub MCP Server – GitHub推出基于 MCP 的服务器工具
GitHub MCP Server 是GitHub 官方推出的基于 Model Context Protocol (MCP 的服务器工具,GitHub MCP Server能无缝集成 GitHub API,为开发者提供高级...
-
发布了文章 2个月前
GitFriend – AI GitHub助手,自动生成定制化README文件
GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具,能简化 GitHub 的使用流程,提升开发效率。GitFriend支持基于 AI 聊天功能为用户提供 Git...
-
发布了文章 2个月前
GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器
GigaTok 是用于自回归图像生成的视觉分词器,参数量达 30 亿。通过语义正则化技术,将分词器特征与预训练视觉编码器(如 DINOv2)的语义特征对齐,有效约束潜在空间复杂度,解决了视觉分词器在扩展时重建质量与生成质量之...
-
发布了文章 2个月前
Genmoai-baidu09smol – 对单GPU设备优化的开源AI视频生成模型
Genmoai-smol是开源视频生成模型,是Genmoai的txt2video模型的工作进展分支,专为单GPU设备优化,减少显存占用,在资源有限的设备上能进行视频创作。模型用高保真度的运动和强大的提示遵循能力而闻名,显著缩...
-
发布了文章 2个月前
Genie Envisioner – 智元推出的机器人世界模型开源平台
Genie Envisioner 是智元推出的首个机器人世界模型开源平台。平台通过一个统一的视频生成框架,集成策略学习、评估和仿真功能。核心组件包括 GE-Base(大规模指令条件视频扩散模型)、GE-Act(动作轨迹解码器...
-
发布了文章 2个月前
Genie 3 – 谷歌DeepMind推出的新一代通用世界模型
Genie 3是谷歌DeepMind推出的新一代通用世界模型,能实时生成高度动态且连贯的虚拟世界。模型具备模拟物理现象、自然生态系统、奇幻场景和历史场景的能力,支持用文本提示改变世界状态,如天气变化或引入新物体。...
-
发布了文章 2个月前
Genie 2 – 谷歌DeepMind推出的最新一代基础世界模型
Genie 2是DeepMind推出的新一代大规模基础世界模型,能仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动态,支持用键盘和鼠标进行操作。Genie 2具备长时...
-
发布了文章 2个月前
Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎
Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。Genesis能用简单的语言描述,快速生成精确的物理模拟,包括物体运动、人物动作和机器人策略等。...
-
发布了文章 2个月前
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术
Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应一个物体及其相关效果(如阴影、反射等)。这项技术无需绿幕或深度...
-
发布了文章 2个月前
GeneralDyG – 南洋理工推出的通用动态图异常检测方法
GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时间 ego-graph 采样模块、图神经网络提取模块和时间感知 Transform...
-
发布了文章 2个月前
GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架
GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,而是用多源高质量人类数据集,包括3D扫描、多视角视频、单...
-
发布了文章 2个月前
GenXD – 新加坡国立和微软共同推出的通用3D和4D联合生成框架
GenXD是新加坡国立大学和微软公司共同推出的3D-4D联合生成框架,能从任意数量的条件图像中生成高质量的3D和4D场景。框架用一个数据整理流程从视频中提取相机姿态和物体运动强度,基于这些信息及大规模4D数据集CamVid-...




























