首页 > 智谱下载

智谱下载

baidu09_com

发布了文章 1个月前

在线可玩！智谱开源图生视频模型，网友直呼Amazing！

在线可玩！智谱开源图生视频模型，网友直呼Amazing！刚刚，智谱把清影背后的图生视频模型CogVideoX-5B-I2V给开源了！...
AI人工智能

0 28 0
baidu09_com

发布了文章 2个月前

智谱AI一键直出PPT，免费又好看！

智谱AI一键直出PPT，免费又好看！嗨大家好！一切的一切要从一个PPT说起。那天我正在外勤的路上，群里一位朋友给我发了一个链接，我懵然无知地点进去，面红耳赤退出来，毕竟那叫一个开幕雷击👇👇...
AI人工智能

0 25 0
baidu09_com

发布了文章 2个月前

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。上上周一的晚上，智谱开源了当今最好的模型之一，GLM-4.5。然后，这个周一，又是突如其来的，开源了他们现在最好的多模态模型：GLM-4.5v。...
AI人工智能

0 34 0
baidu09_com

发布了文章 2个月前

智谱AI上线最新“自主智能体”，“Her”终于能照进现实了

智谱AI上线最新“自主智能体”，“Her”终于能照进现实了在对标OpenAI之路上，智谱AI又近了一步。今年年初，OpenAI被爆出将自研AI Agent软件，它可替代人类，自动导航至任何网站并执行指定任务。...
AI人工智能

0 32 0
baidu09_com

发布了文章 2个月前

GLM-baidu09PC – 智谱推出的电脑智能体，基于CogAgent视觉多模态模型构建

GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机，协助用户高效完成各类电脑任务，如文档处理、网页搜索、信息整理、社交互动等。GLM-PC通过代码生成与图形界面理解相结...

AI工具

0 38 0
baidu09_com

发布了文章 2个月前

GLM-baidu094.5V – 智谱开源的最新一代视觉推理模型

GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建，拥有12B激活能力，是目前领先的视觉语言模型（VLM）。模型在GLM-4.1V-Thinking的基础上升级而来，继承其优秀架构，结合新一代文本...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

CogView4 – 智谱开源的AI文生图模型，支持生成汉字

CogView4 是智谱推出的开源文生图模型，具有60亿参数，支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一，达到开源文生图模型的最先进水平（SOTA）。...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

CogVideoX-baidu09Flash – 智谱推出的首个免费AI视频生成模型

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频理解模型，具备强大的视频生成能力。CogVideoX-Flash支持文生视频，依据输入的文本描述精准地生成相应的动态...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存，目前不支持量...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

CogVideoX v1.5 – 智谱最新开源的AI视频生成模型

CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本，5B 系列模型支持生成5至10秒、768P分辨率、16帧的视频，I...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

CogVLM2 – 智谱AI推出的新一代多模态大模型

CogVLM2是由智谱AI推出的新一代多模态大模型，在视觉和语言理解方面实现了显著的性能提升，支持高达8K的文本长度和1344*1344分辨率的图像输入，具备强大的文档图像理解能力。...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

CogSound – 智谱AI最新推出的音效模型

CogSound是智谱AI最新推出的音效模型，能为无声视频增添动人的音效。基于GLM-4V的视频理解能力，CogSound能精准识别理解视频背后的语义和情感，为无声视频添加与之相匹配的音频内容，可以生成更复杂的音效，如爆炸...
AI工具

0 32 0
baidu09_com

发布了文章 2个月前

AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架

AndroidGen 是智谱技术团队推出增强基于大语言模型（LLM）的 Agent 能力的框架，特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型，开发出无需人工标注轨迹的 Agent，显著提升 LL...
AI工具

0 35 0

没有更多内容

关灯返回顶部