智谱下载
-
发布了文章 1个月前
在线可玩!智谱开源图生视频模型,网友直呼Amazing!
在线可玩!智谱开源图生视频模型,网友直呼Amazing! 刚刚,智谱把清影背后的图生视频模型CogVideoX-5B-I2V给开源了!...
-
发布了文章 2个月前
智谱AI一键直出PPT,免费又好看!
智谱AI一键直出PPT,免费又好看! 嗨大家好!一切的一切要从一个PPT说起。那天我正在外勤的路上,群里一位朋友给我发了一个链接,我懵然无知地点进去,面红耳赤退出来,毕竟那叫一个开幕雷击👇👇...
-
发布了文章 2个月前
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。 上上周一的晚上,智谱开源了当今最好的模型之一,GLM-4.5。然后,这个周一,又是突如其来的,开源了他们现在最好的多模态模型:GLM-4.5v。...
-
发布了文章 2个月前
智谱AI上线最新“自主智能体”,“Her”终于能照进现实了
智谱AI上线最新“自主智能体”,“Her”终于能照进现实了 在对标OpenAI之路上,智谱AI又近了一步。今年年初,OpenAI被爆出将自研AI Agent软件,它可替代人类,自动导航至任何网站并执行指定任务。...
-
发布了文章 2个月前
GLM-baidu09PC – 智谱推出的电脑智能体,基于CogAgent视觉多模态模型构建
GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务,如文档处理、网页搜索、信息整理、社交互动等。GLM-PC通过代码生成与图形界面理解相结...
-
发布了文章 2个月前
GLM-baidu094.5V – 智谱开源的最新一代视觉推理模型
GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建,拥有12B激活能力,是目前领先的视觉语言模型(VLM)。模型在GLM-4.1V-Thinking的基础上升级而来,继承其优秀架构,结合新一代文本...
-
发布了文章 2个月前
CogView4 – 智谱开源的AI文生图模型,支持生成汉字
CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一,达到开源文生图模型的最先进水平(SOTA)。...
-
发布了文章 2个月前
CogVideoX-baidu09Flash – 智谱推出的首个免费AI视频生成模型
CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频理解模型,具备强大的视频生成能力。CogVideoX-Flash支持文生视频,依据输入的文本描述精准地生成相应的动态...
-
发布了文章 2个月前
CogVideoX – 智谱AI推出的开源AI视频生成模型
CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词,能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存,目前不支持量...
-
发布了文章 2个月前
CogVideoX v1.5 – 智谱最新开源的AI视频生成模型
CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本,5B 系列模型支持生成5至10秒、768P分辨率、16帧的视频,I...
-
发布了文章 2个月前
CogVLM2 – 智谱AI推出的新一代多模态大模型
CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和1344*1344分辨率的图像输入,具备强大的文档图像理解能力。...
-
发布了文章 2个月前
CogSound – 智谱AI最新推出的音效模型
CogSound是智谱AI最新推出的音效模型,能为无声视频增添动人的音效。 基于GLM-4V的视频理解能力,CogSound能精准识别理解视频背后的语义和情感,为无声视频添加与之相匹配的音频内容,可以生成更复杂的音效,如爆炸...
-
发布了文章 2个月前
AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型,开发出无需人工标注轨迹的 Agent,显著提升 LL...
没有更多内容