开源mod
-
发布了文章 1个月前
大模型开源大战开打!华为盘古720亿参数全开放
2025年6月30日,华为突然宣布开源盘古Pro MoE 720亿参数模型,所有权重和推理代码上线开源平台。24小时内,百度文心4.5系列、腾讯混元A13B混合推理模型相继开源,三大平台累计开放超2000亿参数模型资源。这场...
-
发布了文章 2个月前
开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑
开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑 开源多模态SOTA模型再易主!Hugging Face开发者大使刚刚把王冠交给了CogVLM2,来自大模型创业公司智谱AI。CogVLM2甚至在3...
-
发布了文章 2个月前
最强开源大模型一夜易主
最强开源大模型一夜易主 阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强。开源界最强大语言模型,Qwen2,来了! 智东西6月7日报道,今日,阿里云正式开源通义千问Qwen2系列模型,其...
-
发布了文章 2个月前
大模型开源大战开打!华为盘古720亿参数全开放
2025年6月30日,华为突然宣布开源盘古Pro MoE 720亿参数模型,所有权重和推理代码上线开源平台。24小时内,百度文心4.5系列、腾讯混元A13B混合推理模型相继开源,三大平台累计开放超2000亿参数模型资源。这场...
-
发布了文章 2个月前
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品 原生多模态大模型性能瓶颈,迎来新突破!上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比,该模...
-
发布了文章 2个月前
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」 曾经创造出Stable Diffusion系列模型的Stability AI,目前面临前所未有的财务危机。这个曾经有10亿美元估值,却只有1...
-
发布了文章 2个月前
最强开源多模态生成模型MM-Interleaved:首创特征同步器
最强开源多模态生成模型MM-Interleaved:首创特征同步器 过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目...
-
发布了文章 2个月前
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 - 紫东太初联合长城汽车开源OpenS2S
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。现在,紫东...
-
发布了文章 2个月前
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单 随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这...
-
发布了文章 2个月前
StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成
StarVector 是开源的多模态视觉语言模型,ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发,专注于将图像和文本转换为可缩放矢量图形(...
-
发布了文章 2个月前
MoshiVis – Kyutai 开源的多模态实时语音模型
MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息相结合,让用户可以通过语音与模型交流图像内容。...
没有更多内容