开源 ocr
-
发布了文章 2个月前
Zerox – 开源的OCR工具,零样本识别多种格式文件
Zerox是开源的本地化高精度OCR工具,基于GPT-4o-mini模型,无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件,擅长处理扫描版文档及复杂布局文件,如含表格、图表等。Zerox工作流程...
-
发布了文章 2个月前
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别
Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内...
没有更多内容





