首页 > global asia 港大

global asia 港大

baidu09_com

发布了文章 2个月前

GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器

GigaTok 是用于自回归图像生成的视觉分词器，参数量达 30 亿。通过语义正则化技术，将分词器特征与预训练视觉编码器（如 DINOv2）的语义特征对齐，有效约束潜在空间复杂度，解决了视觉分词器在扩展时重建质量与生成质量之...
AI工具

0 45 0
baidu09_com

发布了文章 2个月前

Aria-baidu09UI – 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面（GUI）定位任务设计的大型多模态模型。基于纯视觉方法，不依赖于HTML或AXTree等辅助输入，用大规模、多样化的数据合成流程，从Common Crawl...
AI工具

0 42 0

没有更多内容

关灯返回顶部