AI工具
发布文章-
发布了文章 2个月前
Kyutai TTS – Kyutai Labs推出的流式文本转语音技术
Kyutai TTS 是法国人工智能研究机构 Kyutai Labs 推出的流式文本转语音(TTS)技术。是创新的语音合成系统,能实时将文本转换为自然流畅的语音,无需等待完整文本输入即可开始生成音频,延迟极低(仅220毫秒)...
-
发布了文章 2个月前
Kwai Keye-baidu09VL – 快手推出的多模态大语言模型
Kwai Keye-VL 是快手自主研发的多模态大语言模型,基于 Qwen3-8B 语言模型整合SigLIP初始化的视觉编码器,支持动态分辨率输入。模型能深度融合和处理文本、图像、视频等多模态信息,凭借创新的自适应交互机制与...
-
发布了文章 2个月前
KuaiMod – 快手推出的自动化短视频质量判别框架
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略,快速适应短视频平台上内容的快速变化。...
-
发布了文章 2个月前
KuaiFormer – 快手推出的检索框架,基于Transformer
KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“下一个动作预测”范式,有效进行实时兴趣获取和...
-
发布了文章 2个月前
Krea 1 – Krea AI推出的AI图像生成模型
Krea 1 是 Krea AI 推出的 AI 图像生成模型,解决传统 AI 图像生成中的“AI 美学”问题。模型能生成高度逼真、纹理清晰的图像,支持多种艺术风格,提供风格参考系统,支持用户上传图片作为风格参考,将风格应用到...
-
发布了文章 2个月前
Kotaemon – 基于 RAG 技术的开源工具,聊天的方式快速检索文档信息
Kotaemon 是一款基于 RAG 技术的开源工具,支持用户通过自然语言与文档进行互动,快速检索和理解信息。适合需要处理大量文档的场合,如学术研究、企业文档管理、知识管理等。...
-
发布了文章 2个月前
Kokoro-baidu09TTS – 轻量级文本转语音模型,支持多语言多语音风格生成
Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯解码器设计,不使用扩散模型,降低了计算复杂度,具备出...
-
发布了文章 2个月前
Kling-baidu09Foley – 可灵AI推出的多模态视频生音效模型
Kling-Foley 是可灵 AI 推出的多模态视频生音效模型。模型将视频和文本提示作为条件输入,能生成与视频内容语义相关、时间同步的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容,且支持任意时长音频生成。...
-
发布了文章 2个月前
Klear-baidu09Reasoner – 快手开源的推理模型
Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创新是 GPPO算法,通过...
-
发布了文章 2个月前
Klavis AI – 开源MCP集成平台,快速接入生产级MCP服务器
Klavis AI 是一个开源的 MCP(Multimodal Communication Protocol,多模态通信协议)集成平台,帮助 AI 应用快速接入生产级的 MCP 服务器和客户端。平台提供稳定可靠的 MCP 服...
-
发布了文章 2个月前
KittenTTS – KittenML开源的轻量级文本转语音模型
KittenTTS 是轻量级开源文本转语音(TTS)模型,由 KittenML 团队开发。以极小的模型体积(仅 25MB)和强大的 CPU 优化为特点,无需 GPU 即可在低功耗设备上运行,KittenTTS 提供 8 种预...
-
发布了文章 2个月前
Kiss3DGen – 基于图像扩散模型的3D资产生成框架
Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”,将多视图图像及对应的法线图组合成一种拼贴表示,法线图用于重建3D...
-
发布了文章 2个月前
Kiroku – 多智能体系统,模拟学生与导师间互动、组织和撰写文档
Kiroku是多智能体系统,辅助用户组织和撰写文档。灵感源自创始人在斯坦福大学攻读博士期间的学术写作经历,Kiroku模拟学生与导师间的互动,帮助用户快速生成段落、优化沟通方式,在迭代评估中提升信息传递效果。...
-
发布了文章 2个月前
Kimina-baidu09Prover – 月之暗面联合 Numina 推出的数学定理证明模型
Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严谨地证明数学定理。通过独特的“形式化推理模式”,在推理过程中...
-
发布了文章 2个月前
Kimi-baidu09VL – 月之暗面开源的轻量级多模态视觉语言模型
Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)。Kimi-VL支持单图、多图、视频和长...






























