onstep开源goto
-
发布了文章 2个月前
TEN Agent – 开源的实时多模态 AI 代理框架
TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互,支持高性能的实时通信,具备低延迟的音视频交互能力。TEN Agen...
-
发布了文章 2个月前
Onit – 开源的 Mac 桌面 AI 聊天助手
Onit是为Mac设计的AI聊天助手,支持停靠在任何应用程序中。Onit支持高亮文本自动加载,用户只需选择文本,Onit能自动作为上下文打开,无需复制粘贴。...
-
发布了文章 2个月前
OOTDiffusion – 开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式,用户上传自己的模特和服装图片,实现高度自定义的试穿体...
-
发布了文章 2个月前
GOT-baidu09OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出
GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到端的模型由高压缩编码器和长上下文解码器组成,能处理包括文本、数学公式、分子式、图表、乐谱和几何图形在内的多...
没有更多内容









