您所在的位置: 首页 >> 学术活动 >> 正文

学术活动

以图识文:基于合成数据的场景文字检测与识别
发布时间:2016-10-16     浏览量:   分享到:

讲座题目:以图识文:基于合成数据的场景文字检测与识别

讲座人: 白翔 教授

讲座时间:15:00

讲座日期:2016-10-16

地点:长安校区文津楼三段5层522学术研讨室

主办单位:yL23411永利官网登录 智能视觉计算团队

讲座内容:

近年来,场景文字识别 (Photo OCR)成为模式识别及相关领域中的一个热点问题,在图像理解,商品搜索,无人驾驶定位及导航,人机交互及虚拟现实等有着重要的应用价值。本次报告中,我首先会介绍近年来深度学习研究在此领域的研究现状;然后,我将介绍本研究团队在此领域的近期研究成果:基于深度神经网络的场景文字自动矫正方法(CVPR16);基于全卷积网络的多方向场景文本检测方法(CVPR16);基于合成数据的场景文字端到端识别及检索算法框架。最后,对此方向的未来研究趋势和应用前景作出展望。 


讲座人简介:

白翔,华中科技大学电子信息与通信学院教授,博士生导师,国家防伪工程中心副主任。先后于华中科技大学获得学士、硕士、博士学位。曾先后访问于美国Temple大学和加州大学洛杉矶分校,入选微软铸星计划。他的研究领域为计算机视觉与模式识别,具体包括目标识别、形状分析、自然场景文字识别及智能交通系统。他已在计算机视觉与模式识别领域一流国际期刊和会议如PAMIIJCVCVPRICCVECCVNIPSICML上发表论文30余篇。尤其在形状的匹配与检索、场景OCR取得了一系列重要研究成果,引起了国际同行的关注,入选20142015年中国高被引学者。他的研究工作曾获微软学者,国家自然科学基金优秀青年基金的资助。担任中国计算机学会计算机视觉专委会(CCF-CV)常务委员。