GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容记忆以及Function Call功能,支持灵活调用外部知识和工具,拓展应用范围。GLM-Realtime API已经上线,现阶段可以免费调用,为AI硬件发展提供智能基础,助力开发者实现应用创新。

GLM-baidu09Realtime – 智谱推出的端到端多模态模型  第1张
(图片来源网络,侵删)
GLM-baidu09Realtime – 智谱推出的端到端多模态模型  第2张
(图片来源网络,侵删)