uvision智谱
-
发布了文章 2个月前
GLM-baidu09Realtime – 智谱推出的端到端多模态模型
GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容记忆以及Function Call功能,支持灵活调用外部...
-
发布了文章 2个月前
GLM-baidu09PC – 智谱推出的电脑智能体,基于CogAgent视觉多模态模型构建
GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务,如文档处理、网页搜索、信息整理、社交互动等。GLM-PC通过代码生成与图形界面理解相结...
-
发布了文章 2个月前
GLM-baidu094.5V – 智谱开源的最新一代视觉推理模型
GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建,拥有12B激活能力,是目前领先的视觉语言模型(VLM)。模型在GLM-4.1V-Thinking的基础上升级而来,继承其优秀架构,结合新一代文本...
-
发布了文章 2个月前
CogView4 – 智谱开源的AI文生图模型,支持生成汉字
CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一,达到开源文生图模型的最先进水平(SOTA)。...
-
发布了文章 2个月前
CogView3 – 智谱AI推出的开源AI图像生成模型
CogView3是清华大学联合智谱AI推出的开源AI图像生成模型,采用中继扩散技术。模型分阶段生成图像,首先创建低分辨率图像,然后通过中继超分辨率技术提升至高分辨率,提高生成效率并降低成本。CogView3在生成质量和速度上...
-
发布了文章 2个月前
CogVideoX-baidu09Flash – 智谱推出的首个免费AI视频生成模型
CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频理解模型,具备强大的视频生成能力。CogVideoX-Flash支持文生视频,依据输入的文本描述精准地生成相应的动态...
-
发布了文章 2个月前
CogVideoX – 智谱AI推出的开源AI视频生成模型
CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词,能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存,目前不支持量...
-
发布了文章 2个月前
CogVLM2 – 智谱AI推出的新一代多模态大模型
CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和1344*1344分辨率的图像输入,具备强大的文档图像理解能力。...
没有更多内容
















