AI深度学习加持OCR技术,助力多行业智能化升级
旅行时遇到外文菜单,拍张照就能轻松得到翻译;遇到不会做的题,拍照扫描就能获得解答;拿到一份文件,扫一扫就能转换成电子版……
OCR(Optical Character Recognition,光学字符识别)技术已经逐渐进入到我们的生活,但我们常常会受到识别准确度低,识别不够智能的困扰。在近日举行的百度大脑开放日OCR专场活动上,基于深度学习的百度OCR技术令人眼前一亮,超精准的识别、智能化的模型算法、广泛的应用场景让大家看到OCR技术的超越升级。
活动上,百度AI技术生态部产品经理为开发者们详细介绍了百度大脑最新的开放能力,百度视觉技术部韩钧宇深入分享了百度大脑OCR文字识别方向的最新技术与趋势。华夏保险上海分公司、快合财税等企业通过实际案例讲述了他们如何基于百度大脑OCR技术进行企业内部智能化升级的全新思路。百度OCR产品经理进一步分享了交通、教育、医疗等更多行业应用的案例并进行了实际的产品演示。
“高效算法+高能模型”让识别超精准
据介绍,百度大脑AI开放平台面向广泛的企业和开发者,提供最先进、最全面的AI能力,不断降低AI应用落地的门槛。截至目前,已开放218项AI技术能力,达到24小时快速集成,开发者规模持续快速增长并突破150万。
而基于深度学习的百度OCR技术更是获得了持续领先性的成果。2019年,在由工信部、公安部和网信办组织的,中国最高等级商业领域人工智能技术竞赛的90+队伍中,百度OCR获得唯一A级别证书,同时还获得ICDAR2019 MLT文字检测竞赛冠军等荣誉。
“百度OCR基础技术的持续领先,离不开更好效果的算法创新和更高性能的模型压缩。”韩钧宇介绍到。百度OCR文字识别算法具备准确、多场景、多语种、多平台的特性,通用中英文字符识别准确率达95%以上,支持文档,随拍,网图,街景,商品,手写等常见文字场景,并且支持中,英,日,韩,法,德,意等20多种语种,还支持云端,嵌入式,私有化等请求部署方式。而端到端识别、卡证票据识别、公式识别、文字编辑等解决方案则能够更好地解决具体场景的技术痛点问题,提升模型精度和运算效率,让识别更加准确高效。
助力产业智能化升级,企业年省成本1000万
在对“降本增效”的绝对追求下,OCR技术的应用创新,为整个产业“智能化”升级带来有效助力。
此次专场,百度大脑邀请到了华夏保险上海分公司和快合财税两家企业客户根据自身结合百度OCR技术的实际应用落地进行了案例分享。
华夏保险上海分公司新技术应用处经理於维佳表示:“通过百度大脑OCR提供的解决方案,让我们在面临手工录入发票信息出错率高、效率低等行业痛点时,能够显著节约成本、提升财务报销业务流程效率。”华夏保险上海分公司,通过应用百度大脑iOCR自定义模板文字识别和EasyDL定制化物体检测,实现二维码检测、增值税发票识别,进而实现报销单据影像分组及票面识别的自动化业务流程,年节省人力等成本核算达到1000万元。
快合财税产品总监宁寿辉则在现场讲到,基于百度iOCR财会票据识别平台搭建的快合财税智能记账SaaS,结合一台自动馈纸式扫描仪,就能够将快合财税的会计做账效率提升3倍,每年帮助几百家代账公司在做账报税环节合计省出2000万元的成本。
未来,OCR技术的行业应用趋势将向综合方案和定制平台两个方向发展。教育、医疗、交通、财税等场景都已实现通用化的综合解决方案,而iOCR自定义模板文字识别和垂类OCR模型训练平台等定制平台将针对更丰富的客户需求满足个性定制。
作者:蒋竹云