中科院秒懂百科
-
发布了文章 2个月前
Stream-baidu09Omni – 中科院联合国科大推出的语言视觉语音模型
Stream-Omni是中国科学院计算技术研究所智能信息处理重点实验室、中国科学院人工智能安全重点实验室及中国科学院大学联合推出的类似GPT-4o的大型语言视觉语音模型,能同时支持多种模态组合的交互。模型支持大型语言模型为骨...
-
发布了文章 2个月前
MCA-baidu09Ctrl – 中科院和中科大推出的图像定制生成框架
MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的图像生成。...
-
发布了文章 2个月前
LLaMA-baidu09Omni – 中科院推出的低延迟高质量的语音交互模型
LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构,用于实现与大型语言模型(LLM)的低延迟、高质量语音交互。通过集成预训练的语音编码器、语音适配器、大型语言模型(LLM)和一个实时语音...
没有更多内容







