相对其他限定场景OCR应用相比,阿里妈妈要处理的创意图片和商品图片上的文字字体、色彩更加多样,文字布局更加灵活,背景包括各种商品、布景或自然场景,蕴含各种复杂纹理,给识别问题带来了更大的挑战。
盖坤介绍,在技术路线上,相比于传统方法,抛弃了图像预处理、字符分割等流程,采用了多个深度神经网络和语言模型相结合的方法来组成完整的OCR系统。针对复杂的场景信息,将LSTM(长短时记忆)技术成功应用到建模中去,大大提高识别的准确率。
据悉,现在基于OCR文字识别实时审核已覆盖整个阿里妈妈业务,每天处理图片近千万张,自动反馈疑似违规图片准确率达95%以上;同时将图文审核风险发现时间从“天”降低到“秒”级。数据显示,2015年阿里妈妈累计屏蔽了4600万条恶意推广,有效净化了互联网营销环境。
除OCR过滤恶意推广以外,计算机视觉技术在阿里巴巴集团内部已经获得广泛使用,比如手淘的“拍立淘”产品,通过手机拍照即可搜索相似商品,2015年双11当天,千万消费者使用了“拍立淘”功能,创造了超过数千万元的销售额。另外,在商品图片版权保护、鉴黄等场景也都引入了计算机视觉技术。
小编推荐阅读