智源智能
-
发布了文章 2个月前
SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集
SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超高龄老年人的语音数据,总时长达到 55.53小时。...
-
发布了文章 2个月前
FlagevalMM – 智源开源的多模态模型评测框架
FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框架采用评测与模型推理解耦的设计,统一视觉语言模型、文生图、文生视频和图文检索等多种模...
-
发布了文章 2个月前
CCI 3.0 – 智源研究院发布的大规模的中文互联网语料库
CCI 3.0是智源研究院发布的一个大规模的中文互联网语料库,包含了1000GB的数据集和498GB的高质量子集CCI 3.0-HQ。该版本在数据规模上相较于CCI 2.0扩大了近一倍,数据来源机构增加至20多家,提升了数据...
-
发布了文章 2个月前
BGE-baidu09VL – 智源研究院联合多所高校开源的多模态向量模型
BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务,如图文检索和组合图像检索,基于高效的多模态数据合成方法提升模型的泛化能力和检...
没有更多内容









