办公文档识别
可对办公类文档的版面进行分析,输出图、表、标题、文本、印章、栏、页眉、页脚和脚注等位置和分版块内容的OCR识别结果,支持表格识别,印章识别和单字置信度输出,支持中、英、日、韩、法等 20+ 语言类型,手写、印刷体混排多种场景。
功能介绍
文档版面分析
输出文档图片中图、表、标题、文本、目录、印章、栏、页眉、页脚、页码和脚注的信息。
文档混排识别
支持中文、英文两种语言,适配纯手写、纯印刷和手写印刷混排等场景,支持印刷体和手写体分类。
表格文字识别
识别文档中的表格内容,返回各表格的单元格文字内容及其行列位置信息,支持各类表格样式识别。
印章检测识别
检测并识别文档中的印章,输出印章内文字内容和印章位置信息,支持圆形章、椭圆形章、方形章等常见印章。
应用场景
办公场景文档识别
对办公场景的各类文档进行结构化识别,如企业年报、论文、行业报告等,可以分别返回标题、图片、表格、文本、印章、栏、页眉、页脚、页码和脚注的信息,并支持返回单行、单字结果,支持表格和印章识别,方便对文档类图片进行结构化分析。