智谱科技怎么样 第2页
-
发布了文章 2个月前
CogVideoX – 智谱AI推出的开源AI视频生成模型
CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词,能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存,目前不支持量...
-
发布了文章 2个月前
CogVideoX v1.5 – 智谱最新开源的AI视频生成模型
CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本,5B 系列模型支持生成5至10秒、768P分辨率、16帧的视频,I...
-
发布了文章 2个月前
CogVLM2 – 智谱AI推出的新一代多模态大模型
CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和1344*1344分辨率的图像输入,具备强大的文档图像理解能力。...
-
发布了文章 2个月前
CogSound – 智谱AI最新推出的音效模型
CogSound是智谱AI最新推出的音效模型,能为无声视频增添动人的音效。 基于GLM-4V的视频理解能力,CogSound能精准识别理解视频背后的语义和情感,为无声视频添加与之相匹配的音频内容,可以生成更复杂的音效,如爆炸...
-
发布了文章 2个月前
CogAgent-baidu099B – 智谱AI开源 GLM-baidu09PC 的基座模型
CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理,具备双语(中英文)交互能力,能预测并执行GUI操作,...
-
发布了文章 2个月前
AutoGLM – 智谱AI推出的全球首个手机Agent
AutoGLM是智谱推出的全球首个手机Agent,通过AI技术为用户提供高效的操作代理服务。AutoGLM基于国产GLM-4.5和GLM-4.5V模型,具备推理、代码和多模态能力。AutoGLM实现了云端执行,不占用用户本地...
-
发布了文章 2个月前
AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型,开发出无需人工标注轨迹的 Agent,显著提升 LL...















