OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M,包含 250 万条高质量样本,覆盖 16,000 余个跨领域数据库,样本涵盖多种复杂度层级和语言风格。OmniSQL 提供 7B、14B 和 32B 三种模型版本,微调过程中融合了 Spider 和 BIRD 的高质量标注数据。


OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M,包含 250 万条高质量样本,覆盖 16,000 余个跨领域数据库,样本涵盖多种复杂度层级和语言风格。OmniSQL 提供 7B、14B 和 32B 三种模型版本,微调过程中融合了 Spider 和 BIRD 的高质量标注数据。
全部评论
留言在赶来的路上...
发表评论