AI工具
发布文章-
发布了文章 2个月前
WhisperChain – AI实时语音转文字工具,自动对文本进行清理和优化
WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 LangChain 对文本进行清理和优化,去除填充词、编...
-
发布了文章 2个月前
Whisper-baidu09Medusa – aiOla推出的开源AI语音识别模型
Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Medusa引入了多头注意力机制,实现了并行处理,显著提升了推理速度,平均提速达到...
-
发布了文章 2个月前
Whisper Input – 开源AI语音输入工具,支持多语言实时转录和翻译
Whisper Input 是开源的语音输入工具,基于 Python 和 OpenAI 的 Whisper 模型开发。通过简单的快捷键操作(如按下 Option 键开始录音,松开结束录音),实现语音的实时转录和翻译。...
-
发布了文章 2个月前
Westlake-baidu09Omni – 西湖心辰开源的中文情感端到端语音交互模型
Westlake-Omni 是西湖心辰推出的全球首个开源中文情感端到端语音交互大模型。模型采用离散表示法,统一文本和语音模态的处理,特别强调实时性,快速响应用户输入,提供零延迟的交互体验。...
-
发布了文章 2个月前
Weebo – AI语音聊天机器人,实时响应用户语音指令和问题
Weebo是实时语音聊天机器人,基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术,与用户进行自然流畅的对话,提供实时的语音交互体验。...
-
发布了文章 2个月前
WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具
WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模型更好地处理长上下文信息。...
-
发布了文章 2个月前
WebThinker – 人民大学联合智源研究院等机构推出的深度研究智能体
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。...
-
发布了文章 2个月前
WebShaper – 阿里通义推出的AI训练数据合成系统
WebShaper 是阿里巴巴通义实验室推出的创新的 AI 训练数据合成系统。通过形式化建模和智能体扩展机制,为 AI 智能体(Agent)的训练提供了高质量、可扩展的数据。WebShaper 首次引入了基于集合论的“知识投...
-
发布了文章 2个月前
WebSailor – 阿里通义实验室开源的网络智能体
WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 Brows...
-
发布了文章 2个月前
WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型
WebSSL(Web-scale Self-Supervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,基于大规模网络数据(如数十亿图像)训练视觉模型,无需语言监督学习。...
-
发布了文章 2个月前
WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架
WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架,训练使用开放大型语言模型(LLMs)的高性能网络代理。WebRL动态生成任务、结果监督奖励模型(ORM)评估任务成功与否,及自适应强化学习策略,解决训练...
-
发布了文章 2个月前
WebLI-baidu09100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网络中收集大量图像及其对应的标...
-
发布了文章 2个月前
WebDreamer – 基于大语言模型模拟网页交互增强网络规划能力的框架
WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言模型(LLMs),特别是GPT-4o,作为世界模型预测网站上的交互结果。框架模拟可能的用户行为和结果,帮助网络代理在复杂...
-
发布了文章 2个月前
WebDesignAgent – 自动化网页设计AI工具,零门槛搭建各类型网站
WebDesignAgent是一个自动化的网页设计工具,基于AI技术帮助用户轻松创建网站。用户提供简单的文本描述或上传图片,WebDesignAgent生成功能齐全、设计精美的网页。WebDesignAgent支持多页面设计...
-
发布了文章 2个月前
WebAgent – 阿里开源的自主搜索AI Agent
WebAgent是阿里巴巴开源的自主搜索AI Agent,具备端到端的自主信息检索与多步推理能力。WebAgent能像人类一样在网络环境中主动感知、决策和行动,应用在学术研究、商业决策和日常生活。...