首页 科技滚动 阅读正文 :
推荐特斯拉或联手百度推进国内FSD落地

新年献礼:新一代灵云OCR技术登陆灵云平台

来源: 驱动中国 2017-01-04 13:59 访问量:

近日,捷通华声新一代灵云OCR技术正式登陆灵云平台,面向广大个人开发者和企业开发商全面开放。灵云OCR技术为企业智能应用提供名片、身份证、银行卡等图像资料的批量识别能力,识别准确率、识别速度等各项指标业内遥遥领先,满足各行各业对OCR识别技术的应用需求。

新一代灵云智能OCR技术正式上线 面向广大个人开发者和企业开发商全面开放

通过应用最前沿的机器学习算法和深度学习训练集群方法,新一代灵云OCR技术彻底颠覆了传统OCR技术算法,将OCR技术的字正确率提高到99.9%,行正确率(一行字全部识别正确)从80%提高到98%,让机器不再只能识别“清晰、端正的文字”,还能识别“倾斜、相对模糊的文字”,并且支持更多的字体,大大降低了对图片拍摄的要求,让用户可以用更“随意”的姿势拍照。

新一代灵云OCR技术能精准识别身份证、驾驶证、行驶证、银行卡、营业执照、名片、护照、港澳通行证、回乡证、台胞证、大陆证、户口簿、居住证、发票、票据等各类资料文件,全方位满足产业对OCR技术能力的需求。

相比目前市场上的图像识别产品,灵云OCR技术产品具有显著优势:

与企业系统平滑对接:灵云OCR技术支持SDK、HTTP、MRCP等多种API调用方式,可与企业业务系统平滑对接,为业务系统中的扫描仪、高拍仪等专业识别设备,手机、平板电脑、照相机等移动拍照设备提供智能图像识别服务,彻底打破了市场上图像识别技术与硬件设备捆绑销售的局面;

多能力轻松挂接:灵云公有云开放平台和灵云全智能能力平台满足客户各类人工智能应用场景需求。应用灵云公有云开放平台的用户,可以随时根据需求挂接更多的能力项进行敏捷开发,灵云全方位12项人工智能技术为企业应用的智能化保驾护航;应用灵云全智能能力平台的用户可随时根据新增需求挂接相应的识别引擎即可轻松应用,有效降低企业业务系统升级成本的同时,大幅提升了系统的服务潜力。

支持多国混排语言:经过十多年的技术积累与市场应用,灵云OCR技术已全面支持中、英、日、韩、阿拉伯等多国文字的识别,能轻松识别中英、日英、韩英等混合排版,全面满足企业对多语种资料文件的识别需求。

灵云智能OCR技术 达到世界领先水平

OCR(即光学字符识别),是将印刷体字符识别为电子文本的一项人工智能技术,以实现资料信息电子化录入省时、高效等特点而备受关注。

在传统OCR识别过程中,先要将图片进行二值化、噪点和干扰因素去除、页面旋转等预处理,获得清晰端正的影像,再对影像文件进行字符切割、字符识别和版面恢复,输出与原始文件内容和版面一致的电子文件。

此次,由清华实验室与捷通华声科研团队集体攻关,联合研发的新一代灵云智能OCR技术,采用最新的机器学习算法和深度学习训练集群,将模型训练时间从几个月缩短到几天,更是将OCR技术的字正确率提高到99.9%,并支持多国文字的识别,达到世界领先水平。

在模型结构方面:采用最新的深度学习算法——CNN(卷积神经网络),加入海量训练数据,对复杂图像进行有效的图像特征和参数提取,提升了OCR识别的灵活性和适应性;通过最新的OCR识别模型,对专用字体的特征值特殊设定并训练专用的字体模型来保证识别效果。此外,训练OCR识别语言模型,对地址等复杂图像区域的易错字符进行纠正。

在算法优化方面:针对不同的拍照角度,结合底纹处理算法,对识别的兴趣区域进行不同阈值的补光和降噪处理。采用双重定位方法:即对于标准图像采用经典定位方法实现快速识别;对于拍摄不全、图像变形比较严重的图片,通过反归一化重定位算法,将图像进行规范化处理后再进行识别。

新一代灵云智能OCR技术,增加了倾斜校正、版面分析、颜色标记、自动分类和管理等功能,不但实现了识别率高达99.9%的跨越式提升,还可灵活选择PDF、Word、Excel、CSV、txt、xml等多种格式输出保存文件,实现文件的自动分类与电子化管理。

灵云智能OCR技术 全面服务各行各业OCR智能应用需求

新一代灵云智能OCR技术能对大规模的名片、身份证、银行卡等影像资料进行批量、精准识别,为企业智能应用提供智能OCR服务。如:灵云OCR名片识别能力为会展公司批量录入参会人员名片信息,实现自动分类和电子化管理;灵云OCR身份证识别能力为金融企业开户用户统一录入身份证信息;灵云OCR银行卡识别能力在银行、证券、保险等领域,对不同种类的银行卡进行精准高效识别,实现信息的电子化录入。

在最近顺利完成的中信银行影像识别项目中,灵云智能OCR能力平台发挥了巨大作用,不仅实现了办卡流程中身份证、银行卡、名片的自动识别,业务凭单、统一对账单、托管资料等众多纸质资料的精准识别和自动分类,还为中信银行大型用印机的影像识别提供了先进的OCR技术支持,助力中信银行建立了便于管理和检索的电子资料档案库,极大提升了柜台、托管、信贷等业务的办理效率。

目前,灵云智能OCR技术已广泛服务金融、电信、能源、政府、交通、教育、司法、公安、边检等各个领域,大幅提升了企业的信息录入速度和准确率。

捷通华声将进一步深化与清华大学“灵云科技 源自清华”的战略合作,携手系统集成商、解决方案提供商、软件开发商等广大合作伙伴,共同推动新一代OCR技术的产业化普及,让文字录入更精准、更高效,助力企业建立便于管理和检索的电子资料档案库,全面提升企业业务办理效率与客户服务质量。