模态提升
-
发布了文章 3周前
跨模态通信总丢失语义、产生歧义?加入AI大模型,LAM-MSC实现四模态统一高效传输
跨模态通信总丢失语义、产生歧义?加入AI大模型,LAM-MSC实现四模态统一高效传输 本文的作者为湖南师范大学的江沸菠副教授,彭于波博士,湖南工商大学的董莉副教授,英国布鲁内尔伦敦大学的王可之教授,南京大学的杨鲲教授(...
-
发布了文章 2个月前
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力? 2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)...
-
发布了文章 2个月前
全模态RAG突破文本局限,港大构建跨模态一体化系统
全模态RAG突破文本局限,港大构建跨模态一体化系统 突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。香港大学黄超教授团队开源多模态智能处理系统RAG-Any...
-
发布了文章 2个月前
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转 在人工智能领域,跨模态生成(如文本到图像、图像到文本)一直是技术发展的前沿方向。现有方法如扩散模型(Diffusion Models)和流匹配(Flow...
没有更多内容

























