uvision智谱

baidu09_com

发布了文章 2个月前

GLM-baidu09Realtime – 智谱推出的端到端多模态模型

GLM-Realtime是智谱推出的全新端到端多模态模型，具备低延迟的视频理解与语音交互能力，特别融入清唱功能，让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容记忆以及Function Call功能，支持灵活调用外部...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

GLM-baidu09PC – 智谱推出的电脑智能体，基于CogAgent视觉多模态模型构建

GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机，协助用户高效完成各类电脑任务，如文档处理、网页搜索、信息整理、社交互动等。GLM-PC通过代码生成与图形界面理解相结...

AI工具

0 39 0
baidu09_com

发布了文章 2个月前

GLM-baidu094.5V – 智谱开源的最新一代视觉推理模型

GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建，拥有12B激活能力，是目前领先的视觉语言模型（VLM）。模型在GLM-4.1V-Thinking的基础上升级而来，继承其优秀架构，结合新一代文本...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

CogView4 – 智谱开源的AI文生图模型，支持生成汉字

CogView4 是智谱推出的开源文生图模型，具有60亿参数，支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一，达到开源文生图模型的最先进水平（SOTA）。...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

CogView3 – 智谱AI推出的开源AI图像生成模型

CogView3是清华大学联合智谱AI推出的开源AI图像生成模型，采用中继扩散技术。模型分阶段生成图像，首先创建低分辨率图像，然后通过中继超分辨率技术提升至高分辨率，提高生成效率并降低成本。CogView3在生成质量和速度上...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

CogVideoX-baidu09Flash – 智谱推出的首个免费AI视频生成模型

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频理解模型，具备强大的视频生成能力。CogVideoX-Flash支持文生视频，依据输入的文本描述精准地生成相应的动态...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存，目前不支持量...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

CogVLM2 – 智谱AI推出的新一代多模态大模型

CogVLM2是由智谱AI推出的新一代多模态大模型，在视觉和语言理解方面实现了显著的性能提升，支持高达8K的文本长度和1344*1344分辨率的图像输入，具备强大的文档图像理解能力。...
AI工具

0 37 0

没有更多内容