4月11日-14日,全国“视觉与学习青年学者研讨会”(VALSE2019)在安徽国际会展中心举行。会议期间,专注于视觉图像研究领域的国内外各大高校权威学者、青年学子以及该领域代表性科技公司齐聚现场,就前沿科技与最新技术展开深入探讨。作为国际前沿的视觉AI研究机构,腾讯优图实验室受邀参会,为与会者带来了其最新OCR产品解决方案与技术分享。
(VALSE2019腾讯优图展位)
VALSE大会发起于2011年,致力于为计算机视觉、图像处理、模式识别与机器学习研究领域的华人青年学者提供一个自由、平等的深层次学术交流舞台,促进相关领域取得突破性学术成就和成果转化,提升中国青年学者在国际学术舞台上的影响力。腾讯优图算法研究员刘皓作为演讲嘉宾出席,对外分享了腾讯优图在OCR技术领域的学术研究成果与产品解决方案应用实践。
(腾讯优图算法研究员刘皓在VALSE2019)
腾讯优图OCR技术四大优势:适配强、计算快、识别准、应用广
腾讯优图实验室成立于 2012 年,是腾讯旗下一流的 AI 实验室之一,专注人脸人体、图像处理、模式识别、机器学习等领域的技术研究和业务落地。目前,优图的AI 技术已广泛应用在零售、安防、金融、物流等诸多领域,提供超过12个行业解决方案,接入70多条腾讯明星产品业务,拥有超过700项全球专利。在学术成就方面,优图实验室累计申请了327篇国内AI专利和169篇国际AI专利,2019年 3月,优图实验室25篇论文入选全球一流计算机视觉会议CVPR2019的成绩,备受业界瞩目。
经过长期深耕发展,优图在发展得最早也最为成熟的OCR应用方面,已拥有领先行业的四大竞争优势。首先,业务适配强,通用性好。腾讯优图拥有千万级的数据支撑,支持英、日、韩、西、法等19种语言及数字符号,超过20000个汉字识别,具备广泛的适配能力。其次,计算速度快、效率更高。优图OCR技术文字识别速度GPU平均2ms/字符,CPU平均6ms/字符,模型优化迭代快,服务更为稳定。
第三,识别准,在手写体识别领域显著领先。腾讯优图OCR技术手写体识别能力达到国内首家企业级应用标准,手写中文识别准确率达90%以上,手写英文单词级识别准确率更是高达95%以上。最后,应用场景广泛,经过海量服务检验。目前优图已经在腾讯企业内外上百个不同业务中落地应用,日调用量超千万,尤其在物流、银行、保险、政务、手机、教育、互联网等重点行业的几十家大型企业上线应用后,备受用户好评。
促进技术与产业场景融合 助力各行各业实现智慧升级
腾讯优图始终积极推动研究成果在业务领域的落地。在OCR领域,腾讯优图基于多角度文本检测、语义增强的文字识别、公式识别、NLP后处理等基础技术,输出了财务报销凭证识别、证照识别、通用文字识别、单据识别、汽车信息识别、教育试题识别等多个产品解决方案, 并在微信、QQ、顺丰、滴滴出行等一批头部应用中落地。
借助腾讯优图OCR技术,通过对业务场景进行智能改造,能够极大地减少人力成本、提高生产效率。例如优图与顺丰合作,针对运单的收寄件人电话号码和收件人省市区地址信息做了深入的研究,取得高精度的识别成果。快递公司基于这些OCR自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升了运单信息录入效率和物流资源的调度匹配能力。
在技术攻坚方面,针对行业普遍困扰的英文识别难点,包括印刷体、手写体差异大,手写体书写潦草、涂抹痕迹多等问题,腾讯优图OCR技术创造性地采用多种数据增强办法,并融入NPL模型和优化数据筛选等机制,提升了解决方案的鲁棒性,令识别结果更精确,被广泛应用在银行支票、英文菜单、个人名片等诸多领域,极大地提升了用户体验。
秉承“研究成果落地才能产生价值”的原则,腾讯优图始终紧跟时代和技术前沿,在技术研究和业务落地等方面持续发力,输出前沿的视觉技术解决方案,促进技术成果在产业中的落地转化,助力各行各业实现数字化、智慧化转型,加速智慧产业时代的到来。