ocr开源识别框架
-
发布了文章 2个月前
WhisperLiveKit – 开源AI语音识别工具,支持说话人识别
WhisperLiveKit 是开源的实时语音识别工具,能将语音实时转录为文字,支持说话人识别。工具基于先进的技术如 SimulStreaming 和 WhisperStreaming,提供超低延迟的转录功能。工具完全本地化...
-
发布了文章 2个月前
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别
Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内...
没有更多内容





