您所在的位置: 首页 >> 学术活动 >> 正文

学术活动

以图识文：基于合成数据的场景文字检测与识别

发布时间：2016-10-16 浏览量：分享到：

讲座题目：以图识文：基于合成数据的场景文字检测与识别

讲座人: 白翔教授

讲座时间：15:00

讲座日期：2016-10-16

地点：长安校区文津楼三段5层522学术研讨室

主办单位：yL23411永利官网登录智能视觉计算团队

讲座内容：

近年来，场景文字识别 (Photo OCR)成为模式识别及相关领域中的一个热点问题，在图像理解，商品搜索，无人驾驶定位及导航，人机交互及虚拟现实等有着重要的应用价值。本次报告中，我首先会介绍近年来深度学习研究在此领域的研究现状；然后，我将介绍本研究团队在此领域的近期研究成果：基于深度神经网络的场景文字自动矫正方法(CVPR16)；基于全卷积网络的多方向场景文本检测方法（CVPR16）；基于合成数据的场景文字端到端识别及检索算法框架。最后，对此方向的未来研究趋势和应用前景作出展望。

讲座人简介：

白翔，华中科技大学电子信息与通信学院教授，博士生导师，国家防伪工程中心副主任。先后于华中科技大学获得学士、硕士、博士学位。曾先后访问于美国Temple大学和加州大学洛杉矶分校，入选微软铸星计划。他的研究领域为计算机视觉与模式识别，具体包括目标识别、形状分析、自然场景文字识别及智能交通系统。他已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、IJCV、CVPR、ICCV、ECCV、NIPS、ICML上发表论文30余篇。尤其在形状的匹配与检索、场景OCR取得了一系列重要研究成果，引起了国际同行的关注，入选2014、2015年中国高被引学者。他的研究工作曾获微软学者，国家自然科学基金优秀青年基金的资助。担任中国计算机学会计算机视觉专委会（CCF-CV）常务委员。