智谱官网 第2页
-
发布了文章 2个月前
CogVideoX-baidu092 – 智谱 AI 推出的文本到视频生成模型
CogVideoX-2 是智谱 AI开源的文本到视频生成模型,基于先进的 3D 变分自编码器(VAE),将视频数据压缩到原本的 2%,减少资源使用,同时确保视频帧之间的连贯流畅。 通过独特的 3D 旋转位置编码技术,视频在时...
-
发布了文章 2个月前
CogVideoX v1.5 – 智谱最新开源的AI视频生成模型
CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本,5B 系列模型支持生成5至10秒、768P分辨率、16帧的视频,I...
-
发布了文章 2个月前
CogAgent-baidu099B – 智谱AI开源 GLM-baidu09PC 的基座模型
CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理,具备双语(中英文)交互能力,能预测并执行GUI操作,...
-
发布了文章 2个月前
AutoGLM – 智谱AI推出的全球首个手机Agent
AutoGLM是智谱推出的全球首个手机Agent,通过AI技术为用户提供高效的操作代理服务。AutoGLM基于国产GLM-4.5和GLM-4.5V模型,具备推理、代码和多模态能力。AutoGLM实现了云端执行,不占用用户本地...
-
发布了文章 2个月前
AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型,开发出无需人工标注轨迹的 Agent,显著提升 LL...
1 2











