首页 > ocr开源识别框架

ocr开源识别框架

baidu09_com

发布了文章 2个月前

WhisperLiveKit – 开源AI语音识别工具，支持说话人识别

WhisperLiveKit 是开源的实时语音识别工具，能将语音实时转录为文字，支持说话人识别。工具基于先进的技术如 SimulStreaming 和 WhisperStreaming，提供超低延迟的转录功能。工具完全本地化...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

Surya – 开源的OCR工具包，支持90+语言、布局分析等识别

Surya是一款功能强大的开源OCR（光学字符识别）工具包，专门设计用在文档识别，支持超过90种语言的识别。Surya能准确识别出文档中的文本，分析文本的阅读顺序，检测文档中的布局元素，如表格、图片和标题，及识别和解析表格内...
AI工具

0 36 0

没有更多内容

关灯返回顶部