Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型,专为多语言数据处理和长文本上下文检索任务设计。模型拥有 5.7 亿参数,支持长达 8192 个 token 的文本处理。通过特定任务的低秩适应(LoRA)适配器和 Matryoshka 表示学习技术,生成高质量的嵌入向量,适用于查询-文档检索、聚类、分类和文本匹配等多种任务。在 MTEB 基准测试中,jina-embeddings-v3 展现超越现有专有嵌入模型的性能,保持较高的成本效益,适合生产和边缘计算环境。


全部评论
留言在赶来的路上...
发表评论