AI工具
发布文章-
发布了文章 2个月前
gpt-baidu09oss – OpenAI开源的推理模型系列
GPT-OSS 是 OpenAI 推出的开源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 两个版本。gpt-oss-120b 拥有1170亿参数,激活参数约51亿,能在单张 80GB GPU 上运...
-
发布了文章 2个月前
gpt-baidu094o-baidu09transcribe – OpenAI 推出的语音转文本模型
gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(WER),优于前代 Whisper 模型。模型支持多...
-
发布了文章 2个月前
gpt-baidu094o-baidu09mini-baidu09transcribe – OpenAI 推出的语音转文本模型
gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-mini 架构,用知识蒸馏技...
-
发布了文章 2个月前
edge-baidu09tts – 开源的AI文字转语音项目
edge-tts是开源的AI文字转语音项目,支持超过40种语言和300多种声音。edge-tts利用微软Azure Cognitive Services的强大功能,能将文本信息转换成流畅自然的语音输出。edge-tts特别适...
-
发布了文章 2个月前
ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言
ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的文本到语音转换。...
-
发布了文章 2个月前
easegen – AI数字人课程制作平台,智能课件自动批量生成
easegen是一个开源的AI+数字人课程制作项目,集成课程制作、视频管理、智能课件生成到智能出题的全套方案。项目支持PPT课件的批量自动生成、数字人克隆、声音克隆及数字人课程设计和视频渲染等功能。...
-
发布了文章 2个月前
eSearch – 开源的AI桌面应用,截屏、OCR、搜索、翻译、录屏
eSearch是一款开源的跨平台AI桌面应用,集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发,适用于Linux、Windows和macOS系统。用户可以通过快捷键...
-
发布了文章 2个月前
dots.vlm1 – 小红书hi lab开源的首个多模态大模型
dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于一个从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能力。模型在视觉理解和...
-
发布了文章 2个月前
dots.llm1 – 小红书hi lab开源的文本大模型
dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts(MoE)文本大模型,具有 1420 亿参数,激活参数为 140 亿。模型在 11.2T 高质量 token 数据上进行预训练,...
-
发布了文章 2个月前
cpmGO – 面壁智能推出的首个纯端侧汽车智能助手
cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备视觉、语音、多模态交互、图形UI交互等丰富能力,实现舱外至舱内的全链条感...
-
发布了文章 2个月前
cogvlm2-baidu09llama3-baidu09caption – 智普AI开源的视频标注模型,生成文本描述
cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容,自动生成描述视频内容的文本标题或字幕。...
-
发布了文章 2个月前
cobalt – 开源免费的图片、音频和视频下载工具
cobalt是开源免费的图片、音频和视频下载工具,提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台。...
-
发布了文章 2个月前
clone-baidu09voice – 开源的声音克隆工具,支持16种语言
Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在内的16种语言,能将文本转换为语音或将一种声音风格转换为另一种。用户界面友好,操作简...
-
发布了文章 2个月前
autoMate – AI本地自动化工具,自然语言实现自动化任务操作
autoMate是基于AI和RPA的本地自动化工具,用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型,用户无需编程知识,用自然语言描述任务,能完成计算机界面操作、复杂工作流执行及智能决策。...
-
发布了文章 2个月前
auto-baidu09video-baidu09generator – AI自动解说视频生成器
auto-video-generator是AI自动解说视频生成器,能实现一键生成解说视频。用户只需输入主题,系统便自动撰写脚本、合成语音、生成图片并合成视频,极大提升内容创作效率。...