字节=b
-
发布了文章 2个月前
字节按下 AI Agent 加速键
字节按下 AI Agent 加速键 经历了 2025 年初 DeepSeek、Manus 们的冲击,大厂正在重新明确自己下一步的战略。...
-
发布了文章 2个月前
UI-baidu09TARS – 字节跳动推出的开源原生 GUI 代理模型
UI-TARS 是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力,能实时理解动态界面,通过多模态输入(如文本、图像)执行复...
-
发布了文章 2个月前
LLaVA-baidu09OneVision – 字节跳动推出的开源多模态AI模型
LLaVA-OneVision是字节跳动推出开源的多模态AI模型,LLaVA-OneVision通过整合数据、模型和视觉表示的见解,能同时处理单图像、多图像和视频场景下的计算机视觉任务。LLaVA-OneVision支持跨模...
-
发布了文章 2个月前
Boximator – 字节推出的控制视频生成中对象运动的框架
Boximator是有字节跳动的研究团队开发的一种视频合成技术,旨在生成丰富且可控的运动,以增强视频合成的质量和控制性。该技术通过引入两种类型的约束框(硬框和软框)来实现对视频中对象位置、形状或运动路径的精细控制。...
没有更多内容













