开源simplefoc
-
发布了文章 2个月前
Stability AI开源3B代码生成模型:可补全,还能Debug
Stability AI开源3B代码生成模型:可补全,还能Debug Stable Diffusion 3 还没全面开放,这家公司的代码生成模型先来了。本周一,Stability AI 开源了小体量预训练模型 Stab...
-
发布了文章 2个月前
Stable Diffusion 3开源秒翻车,画人好掉san
Stable Diffusion 3开源秒翻车,画人好掉san 没想到……Stable Diffusion 3开源即出现翻车案例。生成一个躺在草地上的女孩,结果长这样?...
-
发布了文章 2个月前
Zonos – ZyphraAI 开源的多语言 TTS 模型
Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zonos根据文本提示和说话人嵌入生成自然、高...
-
发布了文章 2个月前
Whisper Input – 开源AI语音输入工具,支持多语言实时转录和翻译
Whisper Input 是开源的语音输入工具,基于 Python 和 OpenAI 的 Whisper 模型开发。通过简单的快捷键操作(如按下 Option 键开始录音,松开结束录音),实现语音的实时转录和翻译。...
-
发布了文章 2个月前
StyleShot – 开源的AI图像风格迁移模型
StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内容的整合。StyleShot 能捕捉从基本元素到复杂细节的多种风格...
-
发布了文章 2个月前
SimpleQA – OpenAI开源的新基准,用于评估前沿模型的事实准确性
SimpleQA是OpenAI推出的基准测试,用在评估大型语言模型回答简短、寻求事实问题的能力。SimpleQA包含4326个问题,每个问题设计为只有一个正确答案,易于评分”。SimpleQA挑战性强,即使是最先进的大模型如...
-
发布了文章 2个月前
Morphik – 开源的多模态检索增强生成工具
Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术,能理解文档中的视觉内容。...
-
发布了文章 2个月前
DeepCoder-14B:开源AI编码模型挑战闭源的o3-mini和o1
...
-
发布了文章 2个月前
Fish Speech – 开源的高效文本到语音合成TTS工具
Fish Speech是一款由Fish Audio开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果,目前已更新到1.2版本。...
没有更多内容






















