报告简介:
随着智能终端的普及和移动互联网的飞速发展,场景文字识别(Photo OCR)越来越引起学术界和工业界的重视。图片中的文字包含丰富的高层语义,因此如何去检测和识别自然场景中的文字具有广泛的技术应用前景。在这次报告中,我将首先介绍场景文字检测和识别的基本方法、前沿技术以及相关应用。然后,我将介绍我们在此领域的最新研究成果,包括:基于字符定位的场景文字识别算法(CVPR14);基于对称性的文字区域检测算法(CVPR15); 场景文字语种识别方法(ICDAR15);及图像序列识别神经网络等。
报告人简介:
白翔博士现为华中科技大学电子信息与通信学院教授,博士生导师,担任国家防伪工程中心副主任。他的研究领域为计算机视觉与模式识别,具体包括目标识别、形状分析、自然场景文字识别及智能系统。他已在计算机视觉与模式识别相关的国际权威期刊或顶级会议发表论文30余篇。他的研究工作曾获得微软学者2007,首届国家自然科学基金优秀青年基金的资助。他的博士论文获得2012年全国优秀博士论文提名。担任中国图象图形学学会图象视频处理与通信专业委员会秘书长,人工智能学会模式识别专委会委员,计算机学会计算机视觉专业组委员,计算机学会人工智能与模式识别专业委员会通讯委员,视觉与学习青年研讨会(VALSE)在线委员。担任包括权威杂志PAMI、IJCV、TIP、TSMC、TNN、TMM、PR、CVIU、PRL、IVC等评审和顶级会议CVPR ,ICCV, NIPS, ECCV等TPC。