实验室参加IScIDE 2016国际会议

2016年5月13日至2016年5月15日,北京大学信息工程学院ADSP实验室邹月娴教授带领刘诗涵、余嘉胜、王春同学参加了第六届智能科学与大数据工程国际学术会议IScIDE 2016(The 2016 International Conference on Intelligence Science and Big Data Engineering)。本次大会由华南理工大学和中山大学联合承办、IEEE Signal Processing Society协办,大会于2016年5月13日到15日在中国广州召开。会议致力于为国内外智能科学与数据工程领域的研究人员以及工程界人士提供高层次的学术交流平台。大会邀请了6个keynote speakers,其中北京大学高文院士做了题为“Intelligent Processing on Multimedia Big Data”的大会主题报告。该会议吸引了很多来自不同国家和地区高校、研究机构等的著名专家和学者参会,学术界有来自密歇根大学、北卡罗莱纳大学、东京大学等著名国外高校,以及北京大学、浙江大学和台湾大学等许多国内高校。会议论文水平高,EI收录,优秀论文推荐至SCI国际期刊发表,国际影响力高。

本次大会,实验室刘诗涵、余嘉胜和王春同学三位同学的文章被接受发表,大会上,三位同学就发表的论文做了poster展示,介绍了论文的研究思路和实验结果,并与众多学者和专家进行讨论交流,实验室的研究成果在会上得到了很多研究者的关注和认可。

在会议过程中,邹月娴教授和刘诗涵、余嘉胜、王春同学也和世界著名的专家学者进行了深入广泛地交流,探讨领域技术发展方向和各自工作进展。参会收获良多,感受到了学术界的知识氛围,开阔了学术视野,也感受到各国学者专家对新技术的关注和追求。

图一  邹月娴教授和众专家学者合影(左起:大会主席李远清教授、名义主席徐雷教授、80岁高龄的著名学者Amari教授、邹月娴教授和刘智勇研究员)

图二  余嘉胜同学和外国专家进行学术交流

图三  邹月娴教授和刘诗涵、余嘉胜和王春同学会场合影

《机器学习及其应用》课程:商汤科技参观交流

撰稿人:15级黄艺驰

本学期由邹月娴教授讲授的《机器学习及其应用》课程进度过半,在前半学期的课程中,邹老师对机器学习常用的技术和基本方法分专题进行了介绍和讲述,例如:SVM、adaboost、learning theory等,着重帮助同学们构建机器学习的基本理论知识,从而使得同学们能更好更快的进入机器学习领域的研究和探索。在后续课程中,邹老师把教学中心放在了“应用”二字上,机器学习作为人工智能领域至关重要的一部分,不仅在学术界吸引了全球专家学者的热烈探讨,也成为了工业界竞相追逐的“香饽饽”,例如生活中我们熟知的“刷脸”、“语音助手”、“智能机器人”等与人工智能相关的产品,其背后都有着机器学习的算法和技术作支撑,由此也萌生了一大批科技创新公司,其中商汤科技(SenseTime)专注于深度学习技术,由香港中文大学的汤晓鸥教授领军,致力于打造新一代的计算机视觉理解和人工智能引擎,让计算机可以识人、识物,教会计算机看懂这个世界。其领先技术涵盖人脸识别、图像识别、图像处理、智能监控等多个领域。为了增强同学们对机器学习在工业界的应用与认识,在2016年5月6日下午,邹月娴教授安排同学们赴商汤科技公司参观与交流。

图1.邹月娴教授、张帅博士(商汤科技)与同学们在商汤科技公司合影

图1.邹月娴教授、张帅博士(商汤科技)与同学们在商汤科技公司合影

参观伊始,来自商汤科技的张帅博士和他的同事们为我们展示了基于学习的人脸、图像和视频技术产品。其中人脸技术包括:(1)人脸身份认证:给定人脸样本,毫秒级别检索大规模人脸数据库或监控视频,给出身份认证;(2)人脸属性:准确识别10多种人脸属性大类,例如性别、年龄、种族、表情等,可以用于广告定向投放或顾客信息分析;(3)人脸聚类:数十万人的人脸快速聚类,可用于基于人脸的智能相册以及基于合影的社交网络分析,让照片管理更直观,社交关系更清晰;(4)真人检测:检测摄像头前用户是否为真人操作,配合人脸身份认证,为金融等高安全性要求的严肃应用场景提供真人身份验证。图像技术包括:(1)图像去雾:基于图像处理技术,可将受雾或雾霾干扰的照片恢复原貌;(2)超分辨率:利用最新的图像处理和深度学习技术在不损失照片质量的前提下提升其分辨率,使内容的呈现更清晰震撼;(3)文字识别:自动提取票、卡证图像中的文字,如识别购物小票上的物品、价格、日期等信息,自动组织结构。视频技术包括:(1)视频人脸检测跟踪:仅用一张训练图片,实现对镜头捕捉到的人脸检测与识别,该技术可适应侧脸、遮挡、模糊、表情变化等实际环境。参观的同学们对这些产品和技术表现出了浓厚的兴趣,积极参与互动,与商汤科技的技术人员沟通与交流。

图2-3. 基于移动端的人脸和图像app展示

图4.迎宾机(通过一张图片样本实现身份、年龄、性别、表情等属性的识别)

随后,我们进入了会议室,听取商汤科技的两位资深研发组长的讲座,第一位是视频监控研发团队的组长张广辰先生,交谈得知他也是北大毕业,是我们的校友。师兄首先为大家介绍了商汤集团的总体情况,围绕公司定位、目标、核心研发团队、产品和服务四个方面进行了讲述,引发同学们热烈关注,并对商汤集团基于深度学习的技术研发和产品定位产生了浓厚的兴趣。第二位是异构并行计算(HPC)团队组长刘文志先生,他的网名是风辰,闻名于并行计算江湖,曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队),擅长异构并行计算(X86、ARM、GPU、APU、PHI)和大规模集群计算相关,经验丰富。他向大家介绍了异构并行计算在机器学习尤其是深度学习领域的应用,同时也透露他们团队正在搭建基于深度学习平台的操作系统,将于不久发布,相信一经发布,该平台将与Caffee、Theano和TensorFlow一同掀起深度学习的并行异构平台的浪潮。

图5.张广辰先生为同学介绍商汤集团情况

图6.刘文志先生为大家介绍异构并行计算

讲座结束,邹老师和同学们仅仅围绕机器学习技术及其应用向两位嘉宾提问、交流和探讨。刘文志先生透露,他的研发组目前只有5-6个人,虽然人数不多,但承担着整个公司的异构并行计算框架的搭建,关于邹老师提出的如果研究生毕业想进入商汤科技这样的公司需要做哪些方面的努力,他对在座的同学们提出如下建议:要一专多能,专业领域做到90分,其他领域做到70分,要密切关注业界和市场需要什么,做任何事情,如果不能做到市场需要的,那意义就不大,当你没有办法获得支持,很难做下去,而产生价值的最好办法是做出产品,做科研要紧跟市场。到场的其他同学,也就机器学习、异构并行计算以及行业前景等问题,像两位嘉宾进行了提问。活动结束,大家感受到了机器学习在工业界广泛应用的魅力,大大激发了同学们的学习和科研热情,相信未来会有更多机器学习的应用在工业界落地生根,最终实实在在的开花结果,形成产品,更好地服务人民,成为人们生活中不可缺少的一部分。

图7. 邹月娴教授与刘文志先生交流探讨

图8.同学们向嘉宾提问

实验室参加第六届信息科学和技术国际会议( ICIST 2016 )

2016年5月6-8日,北京大学信息工程学院现代信号与数据处理实验室(ADSPLAB)向志强同学参加由大连理工大学主办,IEEE Systems,Man and Cybernetics Society协办的“第六届信息科学和技术国际会议”(Sixth International Conference on Information Science and Technology,简称 ICIST 2016)。会议在辽宁大连瑞诗酒店举行,来自清华大学、北京大学、东京大学、台湾大学、上海交通大学、国防科技大学、大连理工大学等单位的参会者们就信息与相关学科的理论与应用研究进行了广泛深入的学术交流。

会议上,C. L. Philip Chen,Shyi-Ming Chen,Tak Wu Sam Kwong和Yuhui Shi四位IEEE Fellow 分别作了关于深度学习和优化问题求解方法的主题演讲,介绍了学科领域的新工具、新方法和研究进展与现状。

图 1 IEEE Fellow Yuhui Shi 教授做题为“From Brainstorming to Brain Storm Optimization Algorithm”的主题报告

在本次大会上,向志强同学就发表的题为“Robust Vehicle Logo Recognition Based on Locally Collaborative Representation With Principal Components”的论文做了口头汇报,介绍了论文的选题背景、研究问题、研究思路和实验结果,并与中国科学院等单位的相关专家进行讨论交流,研究成果受到广泛地关注。

在会议过程中,向志强同学也结识了同领域的相关学者与研究生,在交流过程中感受到了领域发展的迅速和学术工作的严谨。在参会之余向志强同学也感受到“北方明珠”大连的城市繁华与和谐,“浪漫之都,时尚大连”。

 

实验室参加BigMM 2016国际会议

                                                                                                                      撰稿人:王春

2016年4月20日至2016年4月22日,北京大学信息工程学院ADSP实验室王春同学参加了第二届国际多媒体大数据大会,BigMM 2016(the 2st IEEE International Conference on Multimedia Big Data)。本次大会由IEEE Signal Processing Society主办,于2016年4月20日到22日在中国台北召开。BigMM会议由中国工程院院士、北京大学高文教授和UIUC教授Thomas X. Huang于 2015年联合发起,旨在解决大数据时代背景下的多媒体大数据分析和处理问题,以及分布式计算和海量数据的处理问题,该会议吸引了很多来自不同国家和地区高校、研究机构和相关产业界的著名专家和学者参会,学术界有来自东京大学、名古屋大学、伊利诺伊大学香槟分校等著名国外高校,以及清华大学、北京大学、南方科技大学、中国科学院大学和台湾大学等许多国内高校;工业界也不乏各大公司的身影,包括HTC等等。会议论文水平高,EI收录,优秀论文推荐至SCI国际期刊发表,国际影响力高。

本次大会,实验室向志强和王春两位同学的文章被接受发表,大会上,王春同学就发表的论文做口头汇报,介绍了论文的研究思路和实验结果,并与众多学者和专家进行讨论交流,实验室的研究成果在会上得到了很多研究者的关注和认可。

在会议过程中,王春同学有幸聆听了世界著名的专家学者做的精彩的主题报告,了解到学科领域的新工具新方法和研究进展与现状。同时也和来自世界各地的学者、研究生进行了深入广泛的交流。

图一  王春同学在做presentation

 

图二  王春同学会场合影留念

实验室参加ICASSP 2016国际会议

撰稿人:2014级金彦含

2016年3月20日-2016年3月25日,北京大学深圳研究生院信息工程学院ADSP实验室邹月娴教授带领实验室金彦含同学,参加了著名而具有悠久历史的第四十一届语音信号处理国际顶级会议ICASSP2016(the 41th IEEE International Conference on Acoustics, Speech and Signal Processing)。本次大会由IEEE Signal Processing Society主办,于2016年3月20日到25日在中国上海召开。 ICASSP是国际声学语言和信号处理的旗舰会议,其学术水平和影响力在语音信号处理领域属于最重要的国际会议,每届盛会都吸引很多来自不同国家和地区高校、研究机构和相关产业界的著名专家和学者参会,展示信号和信息处理的最新研究成果,讨论科技和产业发展趋势。

本次大会,实验室金彦含同学的文章被接受发表,大会上,金彦含同学就发表的文章做了poster展示( “Robust Speaker DOA Estimation with Single AVS in Bispectrum Domain”),介绍了论文的研究思路和实验结果,并与众多学者和专家进行讨论交流,得到了很多研究者的关注和认可。

在会议过程中,有幸聆听了世界著名的专家学者斯坦福大学Boyd教授做的关于凸优化的主题演讲:”Convex Optimization with Abstract Linear Operators”,以及华为首席技术官Wen Tong做的关于5G技术的主题演讲:“5G Wireless Enabling Technologies”。了解到学科领域的新工具新方法和研究进展与现状。

同时邹月娴教授和金彦含同学也和来自世界各地的学者、研究生进行了深入广泛地交流,探讨领域技术发展方向和各自工作进展。参会收获良多,感受到了学术界的知识氛围,开阔了学术视野,也感受到各国学者专家对新技术的关注和追求,同时也结识了同领域的博士和学者,领略了上海现代都市的繁华。

Ritz博士应邹教授邀请来我院做学术交流

撰稿人:宋晓

2015年12月15日上午,应邹月娴教授的邀请,来自澳大利亚Wollongong大学的Christian Ritz博士到我院进行学术交流,并在C栋106教室做了题为“Ad-Hoc Microphone Array Applications and Multizone Spatial Audio”的学术讲座。

Christian Ritz博士从2003年起在Wollongong大学的Visual and Audio Signal Processing Lab工作,主要的研究领域有:single and multichannel speech and audio signal processing, spatial audio signal processing, acoustic signal processing for microphone and loudspeaker arrays和acoustic design of musical instrument and multimedia Quality of Experience (QoE)。

Christian Ritz博士主要从他研究的两个方向做讲解:第一个是关于“Ad-hoc microphone array research”;第二个是关于“Multizone spatial audio research”。并通过一些demo直观地展示了其研究的算法,让同学们了解到其性能。随后与在场专家和同学们针对以上两个研究方向,分别进行了较为深入的讨论。

图1 Ritz教授在做学术演讲

图2 同学们在仔细聆听Ritz教授的演讲

图3 Ritz教授与在场专家及同学们进行讨论

实验室参加ROBIO2015国际会议

撰稿人:余嘉胜

2015年12月6日-12月9日,北京大学深圳研究生院信息工程学院ADSP实验室邹月娴教授与余嘉胜同学参加了在珠海德翰大酒店召开的第12届ROBIO 2015(IEEE Conference on Robotics and Biomimetics)国际会议。本届ROBIO会议吸引了超过40个国家和地区包括澳洲、德国、美国、日本、印度等国家的专家学者的投稿,国内投稿的研究机构包括中科院自动化所、清华大学、北京大学和国防科技大学等重点高校,大会投稿572篇,接收398篇,内容涵盖了机器人控制、机器人视觉和仿生学的各个领域。余嘉胜同学发表了题目为“A Hybrid Convolutional Neural Networks with Extreme Learning Machine for WCE Image Classification”的学术论文并进行了poster展示。

在会议过程中,邹月娴教授和余嘉胜同学有幸聆听了世界著名的专家学者做的精彩的主题报告,如首尔大学的Cho教授关于“Soft Bio-inspired Robotics”的主题演讲、佐治亚理工大学的Arkin教授关于“Temporal Heterogrneity and the Value of Slowness in Robotic Systems”的主题演讲,Paul教授主持的“Visual Sensing Theory and Practice”部分和香港大学Liu教授主持的“Object Recognition and Detection with Vision”部分,了解到机器人和机器人视觉领域的新工具新方法和研究进展与现状。同时邹月娴教授与余嘉胜同学也和来自世界各地的学者、研究生进行了深入广泛地交流,探讨领域技术发展方向和各自工作进展。参会收获良多,亲自感受了学术界的知识氛围,开阔了学术视野,同时也结识了同领域的博士和学者,在参会之余也领略了幸福之城浪漫之城珠海的繁华和珠海人民的生活态度。

 图 1 余嘉胜同学在会场留念

图 2 余嘉胜同学在做poster展示

图 3 邹月娴教授和余嘉胜同学在会议晚宴合影留念

 

《模式识别》课程专题讲座

撰稿人:黄艺驰

 2015年12月4日上午,本学期《模式识别》课程安排了一次专题讲座。课程主讲人邹月娴教授邀请了三位在模式识别领域取得了优秀研究成果的嘉宾给同学们进行了一次专题讲座。他们分别是北京大学信息工程学院朱跃生教授的博士生罗桂波、高文院士的博士后赵洋博士和刚刚加入商汤集团(SenseTime)的香港大学毕业生张帅博士。

 

首先,罗桂波师兄给我们分享了他的研究成果——《快速视觉跟踪算法研究及其在嵌入式系统上实现》。视觉跟踪是指在图像序列中连续定位所选的物体,并进一步获取其他时空变化信息,包括目标的运动速度、方向和轨迹等。该技术在视频监控、人机交互、智能交通、医疗卫生、体育竞技和视频压缩等方面有广泛的应用。算法设计的挑战在于:(1)在目标发生部分遮挡,光照变化和形变等情况下,算法仍然能准确跟踪目标;(2)目标失去跟踪后,在一定的时间内,仍可以恢复跟踪;(3)算法要复杂度低,速度快。针对上述三个挑战性需求和传统的在线学习视觉跟踪算法在复杂多变的环境下,无法同时满足适应性高和稳定性好的要求,罗桂波师兄开展了基于在线学习的快速视觉跟踪算法研究及实现,以提高算法的综合性能。主要完成了以下四个方面的工作;(1)提出了一种跟踪与检测相结合的切换模式框架;(2)在线自适应提升算法中,提出了一种改进的特征选择方法;(3)使用多种优化技术提高了算法的运行速度;(4)算法在嵌入式系统上的实现。其改进的算法在基于分类的跟踪算法中,引入模板匹配和目标模型,较好克服了适应性和稳定性这对矛盾,目标丢失后可以恢复跟踪,切换模式框架大大减少了计算量,使得算法可以达到实时效果。这个算法最终获得了2011-2012年度”德州仪器DSP及嵌入式大奖赛-算法组“三等奖和2012年”第八届中国研究生电子设计竞赛“华南赛区一等奖、全国赛二等奖。难能可贵的是,罗桂波师兄不仅设计、仿真和验证了改进算法,还把改进算法实现在嵌入式系统中。这些工作都是其在硕士期间完成的,工作量之大、努力程度之高着实让同学们敬佩。

图1.罗桂波师兄给我们分享《快速视觉跟踪算法研究及其在嵌入式系统上实现》

图1.罗桂波博士分享《快速视觉跟踪算法研究及其在嵌入式系统上实现》

随后,赵洋博士介绍了其研究成果——《基于图像局部特征的超分辨率技术研究》。图像超分辨率技术是下一代电视依赖的最核心技术,它可以广泛的应用于图像编辑、医学图像处理、物体识别、遥感图像等。图像超分辨率(Super-Resolution)又被称为图像上采样(Upsample),上尺度(Upscale),通过低分辨率图像(Low-Resolution-Image,LRI)获取高分辨率(High-Resolution-Image,HRI)的过程。主要用于改善图像的边缘和纹理,使图片边缘更加锐利、纹理更加清晰。赵洋博士首先介绍了三种传统的超分辨率技术——基于差值、基于重建和基于样例,分析了这三种算法的优缺点。然后,针对传统算法复杂度高、恢复降采样过程中损失的高频纹理细节信息等缺点,为了更好地提高纹理超分辨率的视觉质量,分别对传统算法进行了改进和优化。在基于重建的超分辨率方法基础上,提出了基于局部结构约束的重建方法;在基于字典的超分辨率方法上,提出了多级线滤波网络方法、迭代投影重建方法和基于局部块分类的框架。赵洋博士在介绍其研究工作时思路清晰严谨,PPT图文并茂,给同学们留下了深刻印象,对同学们今后汇报研究工作有着重要指导意义。

图2 赵洋博士介绍《基于图像局部特征的超分辨率技术研究》

图2. 赵洋博士介绍《基于图像局部特征的超分辨率技术研究》

 

之后,来自SenseTime的张帅博士分享了《基于深度学习的人脸技术》。张帅师兄博士毕业后选择了直接加入科技创新公司SenseTime。SenseTime是一家科技创新公司,由香港中文大学的汤晓鸥教授领军,致力于打造新一代的计算机视觉理解和人工智能引擎,让计算机可以识人、识物,教会计算机看懂这个世界。其领先技术涵盖人脸识别、图像识别、图像处理、智能监控等多个领域。与前两位师兄不同的是,张帅博士并没有对一个具体的模式识别领域技术和算法研究进行介绍,而是从宏观的、技术应用层面对人脸技术展开了分享。这对毕业后想直接工作或者以后想走技术应用路线的同学们有着重大指导意义。张帅博士从人脸技术发展史、深度学习发展史、深度学习驱动的人脸技术、深度学习展望、商汤集团研究和产品概述等五个方面对人脸技术、深度学习从产业应用层面进行了生动介绍,例如:基于深度学习的图像视频处理、基于深度学习的监控技术、基于深度学习的图像识别和搜索以及文字识别技术。最后,张帅师兄还展示了SenseTime推出的人脸识别相关技术产品的demo视频,同学们对深度学习和人脸识别技术在日常生活中的广泛使用惊叹不已。

图3 张帅博士分享《基于深度学习的人脸识别技术》

图3. 张帅博士介绍《基于深度学习的人脸技术》

 

       讲座的最后,邹老师邀请三位讲座嘉宾为同学们答疑解惑。同学们也踊跃参与提问,三位嘉宾对同学们的疑惑进行了耐心的解答。同时,邹老师就如今产业界对硕士毕业生加入科技创新公司的技能要求、模式识别技术在应用层面亟需解决的问题等方面与三位嘉宾也进行了深入探讨。本次讲座,同学们都收获颇丰,极大的激发了大家对模式识别课程的理解和学习的兴趣。

图4 同学们向讲座嘉宾提问

图4. 同学们向讲座嘉宾提问

图5 邹月娴教授、罗桂波博士、赵洋博士、张帅博士与同学们合影

图5. 邹月娴博士、罗桂波博士、赵洋博士、张帅博士与同学们合影

图6 邹月娴教授、罗桂波博士、赵洋博士、张帅博士与同学们合影

图6. 邹月娴博士、罗桂波博士、赵洋博士、张帅博士与同学们合影

王文武博士应邹教授邀请来我院做学术交流

撰稿人:王迪松

2015年8月18日上午,应邹月娴教授的邀请,来自英国萨利大学的王文武博士到我院进行学术交流,并在C栋106教室做了题为“Probabilistic Time-Frequency Masking for Convolutive Blind Source Separation”的学术讲座。

王文武博士在2007年加入萨里大学视觉语音与信号处理中心的A-Lab(Machine Audition Lab) 实验室,主要的研究领域有:信号盲分离、机器学习、机器学习和感知、稀疏信号表达、语音音频信号处理等,在各个领域的研究中均有出色的成果发表并且他的团队在2012年DSTL Challenge Workshop for the signal processing challenge “under-sampled signal recognition” 中获得Best Solution Award。

王文武博士首先介绍了他在视觉语音与信号处理中心所作的工作,然后以鸡尾酒会问题为引,针对语音分离这个领域,详细介绍了几种语音分离算法包括IBM、ICA等,并且展示了各种算法的demo,让同学们直观地了解到算法的性能,最后介绍了稀疏表示和字典学习在语音分离中的应用。

图1:王文武博士在做学术演讲

图2:同学们在仔细聆听王博士的演讲

随后,语音小组的成员汇报了他们近期的工作。柳俊宏同学介绍了语者确认技术,刘诗涵同学介绍了语音增强技术,王春同学介绍了录音回放攻击检测技术,金彦含同学介绍了鲁棒的语音声源DOA估计技术,郑炜乔同学介绍了语音情感识别技术,王迪松同学介绍了基于稀疏表示和字典学习的DFL算法研究,张小虎同学介绍了多通道麦克风语音采集嵌入式系统。在汇报过程中,王文武博士和同学们互相交流,让同学们受益匪浅。

图3:柳俊宏同学在做口头汇报

图4:刘诗涵同学在做口头汇报

在热烈的掌声中讲座圆满结束,王文武老师对我们实验室的研究给予了充分肯定,并提议在基于NMF的语音增强技术领域开展合作,最后老师和同学们拍照留念。

图5:老师和同学们的合影

ADSP实验室邀请学术界和工业界专家开展视频图像技术研讨会

撰稿人:王毅

2015年8月13日上午,应邹月娴教授邀请,学术界和工业界的8位专家来到ADSP实验室参加开展的视频图像技术研讨会。他们分别是深圳大学教授黄云森、深圳云天励飞技术有限公司创始人兼CEO陈宁博士,中检集团南方电子产品测试有限公司主任工程师赵燕妮女士,深圳信息职业技术学院教授柳伟博士,深圳大学副教授廖斌博士,深圳市睿海智电子科技有限公司总经理尹武博士,深圳职业技术学院向怀坤博士,杭州海康威视数字技术股份有限公司售前技术经理肖柏懿先生。ADSP视频小组成员向志强、余嘉胜、王毅、陈锦、黄晓林一并参会并给与会专家汇报实验室视频方面的相应成果。

在研讨会上,在邹月娴教授首先介绍了实验室的基本情况和主要研究方向和内容,随后由实验室视频小组成员具体介绍实验室视频技术研究成果,主要从应用背景、技术路线和技术成果展示三方面向专家做了介绍。其中陈锦同学介绍了无线胶囊内窥镜器官分类技术和基于电梯视频录像的性别检测技术;余嘉胜同学介绍了基于深度网络CNN的交通监控视频中人车分类技术和无线胶囊内窥镜器官分类技术;王毅同学介绍了图像去雾、基于学习的图像超分辨率重构和图像类比技术;向志强同学介绍了基于稀疏表示的城市道路监控车型识别技术和车标识别技术;黄晓林同学介绍了基于低秩约束的图像校正技术、面向图像和视频的密集背景物体计数技术和隔空手势识别和手写识别技术。

图1. 邹月娴教授与参会专家听视频组组员汇报工作

图2. 向志强同学汇报城市道路监控车型识别技术

图3. 黄晓林同学汇报图像校正技术

参会专家对实验室成果表示了极大的兴趣,对很多技术和应用细节进行了提问;同时也根据他们的行业或学术经验对我们视频小组提出了很多实用的建议,比如定期将技术整理成库,结合工业界现状和完成的一些小课题尝试一些大课题项目等。

之后由杭州海康威视数字技术股份有限公司售前技术经理肖柏懿介绍了他们公司最近开展的一个项目,关于教学管理和监控的综合系统,因涉及到学生隐私和教育问题引起了大家激烈的讨论。

图4. 黄云森教授发表观点

图5. 邹月娴教授与陈宁博士讨论

经过近两个小时的研讨,同学们充分锻炼了自己的表达能力,从和专家的交流中知悉了工业界、学术界对目前自己研究方向的需求,汲取了宝贵的经验。