AI工具
发布文章-
发布了文章 2个月前
VoltAgent – 开源的AI Agent构建和编排框架
VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具,简化与大语言模型(LLM)的交互、状态管理、外部工具连接和工作流编排的复杂...
-
发布了文章 2个月前
Voila – 开源端到端语音大模型,实现低延迟语音对话
Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。...
-
发布了文章 2个月前
Void – 开源的AI辅助编程工具,代码自动补全和智能建议
Void 是基于 Visual Studio Code 构建的开源文本编辑器,集成AI技术增强编程体验。Void支持代码自动补全、内联编辑、AI 驱动的代码搜索,直接与大型语言模型(如 Claude、GPT 或 Gemini...
-
发布了文章 2个月前
VoiceCraft – 开源的语音编辑和文本转语音模型
VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言模型,专注于零样本语音编辑和文本到语音(TTS)任务。该模型采用Transformer架构,通过创新的token重排过程,结合因果掩蔽和延迟叠加...
-
发布了文章 2个月前
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanva...
-
发布了文章 2个月前
Voice-baidu09Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式...
-
发布了文章 2个月前
Voice Engine – OpenAI公布的AI语音合成和声音克隆模型
Voice Engine是OpenAI最新推出的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本输入,生成接近原声的自然听起来的语音。该项技术自2022年底开发以来,已经被应用于OpenAI的文本到语音AP...
-
发布了文章 2个月前
Voice Changer – Cartesia推出转换声音同时保留原始情感的变声器模型
Voice Changer是Cartesia推出的新模型,能将任何音频剪辑的语音转换成其他音色,且保留原始音频的情感和表达。用户从Cartesia提供的多种高质量声音库中选择,或克隆自己的声音,且完全控制语音的细节,如发声、...
-
发布了文章 2个月前
VisoMaster – AI换脸和编辑软件,支持图片和视频高质量换脸
VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真的换脸效果,应用于娱乐、影视制作等领域。支持多种输入输出格式,可通过 GPU 加速处理,大幅提升效率。...
-
发布了文章 2个月前
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力
VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、成像模态、设备和人群统计数据。VisionFM能处理包括眼底...
-
发布了文章 2个月前
Vision Search Assistant – 结合视觉语言模型和网络代理搜索技术的开源框架
Vision Search Assistant(VSA)是结合视觉语言模型(VLMs)和网络代理的框架,提升模型对未知视觉内容的理解能力。基于互联网检索,使VLMs处理和回答有关未见图像的问题。VSA在开放集和封闭集问答测试...
-
发布了文章 2个月前
Vision Parse – 开源的 PDF 转 Markdown 工具
Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且保持原有的格式和结构。Vi...
-
发布了文章 2个月前
VirtualWife – AI虚拟数字人项目,可在B站进行直播
VirtualWife是一个创新的虚拟数字人项目,专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互动,提供娱乐和信息。通过集成先进的AI技术,如自然语言处理和机器学习,VirtualWife的角色能理解和响...
-
发布了文章 2个月前
VirSci – 上海人工智能实验室推出的多智能体AI科学研究工具
VirSci(Virtual Scientists)是上海人工智能实验室推出的多智能体AI科学研究工具,基于模拟科学家团队的合作过程加速科研创新。系统基于大型语言模型(LLMs),用组织智能体团队合作生成、评估和完善研究创意...
-
发布了文章 2个月前
ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法
ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SVD)的生成先验合成远超出训练视图范围的新视角。这种方法基于重新设...






























