简 历:
2006年3月博士毕业于中国科学院计算技术研究所(简称计算所)后留所工作,2008年3月起先后任副研究员和研究员、硕士生导师和博士生导师,中国计算机学会和中国图象图形学会多媒体专委会委员。在国家973、863、国家重点研发计划项目、国家自然科学基金和242重点项目的支持下,带领团队长期从事多媒体内容分析与检索、计算机视觉与模式识别研究,相关论文发表于多媒体、计算机视觉和人工智能的国际顶级会议ICCV、CVPR、ECCV、ACM Multimedia、AAAI、IJCAI、MICCAI和国际顶级期刊IEEE T-PAMI、T-IP等。研发的多项图像视频分析、检索与识别系统已经在国家相关部门获得大规模应用,部署在全国多地,应用效果显著。主持2014年全国首届特定音视频检索识别挑战赛视频评测;带领团队在美国NIST举办的视频检索国际评测TRECVID 2008和国际著名的ImageNet大规模视觉识别挑战赛(ILSVRC 2016)中取得优异成绩,并受邀做大会报告。荣获中国计算机学会科学技术奖1项、中国电子学会科学技术奖一等奖2项、北京市科学技术奖一等奖3项、国家自然科学二等奖1项。
主要论著:
期刊文章(CCF A类期刊4篇,CCF B类期刊7篇,*表示通讯作者):
[1] Sheng Tang, Yan-Tao Zheng, Yu Wang and Tat-Seng Chua, “Sparse Ensemble Learning for Concept Detection”, IEEE Transactions on Multimedia, 14(1):43-54, Feb. 2012. (CCF B类多媒体国际期刊)
[2] Sheng Tang, Yu Li, Lixi Deng, Yong-Dong Zhang; “Object Localization Based on Proposal Fusion”, IEEE Transactions on Multimedia, 19(9):2105-2116, September 2017. (CCF B类多媒体国际期刊)
[3] Rui Zhang, Sheng Tang*, Yongdong Zhang*, Jintao Li, Shuicheng Yan, "Perspective-adaptive Convolutions for Scene Parsing", IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 42(4): 909 – 924, April, 2020. (CCF A类人工智能著名国际顶级期刊)
[4] Tianyi Wu, Sheng Tang*, Rui Zhang, Juan Cao, Yong-Dong Zhang; “CGNet: A Light-weight Context Guided Network for Semantic Segmentation”, IEEE Transactions on Image Processing, 30(1):1169-1179, 2021. (CCF A类图像处理国际顶级期刊)
[5] Yu Li, Sheng Tang*, Rui Zhang, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Asymmetric GAN for Unpaired Image-to-image Translation”, IEEE Transactions on Image Processing, 28(12):5881-5896, December, 2019. (CCF A类图像处理国际顶级期刊)
[6] Yu Li, Sheng Tang*, Min Lin, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Implicit Negative Sub-categorization and Sink Diversion for Object Detection", IEEE Transactions on Image Processing, 27(4):1561-1574, April, 2018.(CCF A类图像处理国际顶级期刊)
[7] Linghui Li, Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian; “GLA: Global-local Attention for Image Description”, IEEE Transactions on Multimedia, 20(3): 726-737, March, 2018. (CCF B类多媒体国际期刊)
[8] YongDong Zhang, Yu Wang, Sheng Tang*, Steven C. H. Hoi, JinTao Li; “FSpH: Fitted Spectral Hashing Exploring Entropy Maximizing Criterion for Efficient Retrieval”, Computer Vision and Image Understanding (CVIU), Computer Vision and Image Understanding (CVIU), 124: 3-11, 2014. (CCF B类国际著名期刊)
[9] Wu Liu, Yongdong Zhang, Sheng Tang, Jinhui Tang, Richang Hong and Jintao Li; "Accurate Estimation of Human Body Orientation From RGB-D Sensors," IEEE Transactions on Cybernetics, vol.43, no.5, pp.1442-1452, Oct. 2013. (CCF B类国际期刊)
[10] Hongtao Xie, Ke Gao, Yongdong Zhang, Sheng Tang, Jintao Li, and Yizhi Liu; “Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Image Search”, IEEE Transactions on Multimedia, 13(6):1319-1332, Dec. 2011. (CCF B类多媒体国际期刊)
[11] Yan Song, Yan-Tao Zheng, Sheng Tang, Xiangdong Zhou, Yongdong Zhang, Shouxun Lin, and Tat-Seng Chua; “Localized Multiple Kernel Learning for Realistic Human Action Recognition in Videos”, IEEE Transactions on Circuits and Systems for Video Technology, 21(9):1193-1202, Sept.2011. (CCF B类国际期刊)
会议文章(国际顶级会议长文14篇,其中CCF A类会议10篇, *表示通讯作者):
[12] Rui Zhang, Sheng Tang*, YongDong Zhang, Jintao Li, Shuicheng Yan; “Scale-adaptive Convolutions for Scene Parsing”, The 2017 IEEE International Conference on Computer Vision (ICCV) 2017, Pages: 2050-2058, Venice, Italy, October 22-29, 2017. (CCF A类计算机视觉国际顶级会议长文)
[13] Yu Li, Tao Wang, Bingyi Kang, Sheng Tang*, Chunfeng Wang, Jintao Li, Jiashi Feng; “Overcoming Classi?er Imbalance for Long-tail Object Detection with Balanced Group Softmax”; IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, Washington, USA. June 16-18, 2020. (CCF A类计算机视觉国际顶级会议长文, Oral)
[14] Junbin Xiao, Xindi Shang, Xun Yang, Sheng Tang, Tat-seng Chua; “Visual Relation Grounding in Videos”; 16th European Conference on Computer Vision (ECCV'20), 23-28 August 2020. (CCF B类计算机视觉国际顶级会议长文, Spotlight)
[15] Tao Wang, Yu Li, Bingyi Kang, Junnan Li, Jun Hao Liew, Sheng Tang, Steven Hoi, Jiashi Feng; “The Devil is in Classification: A Simple Framework for Long-tail Instance Segmentation”; 16th European Conference on Computer Vision (ECCV'20), 23-28 August 2020. (CCF B类计算机视觉国际顶级会议长文)
[16] Bin Wang, Guojun Qi, Sheng Tang*, Tianzhu Zhang, Yunchao Wei, Linghui Li, Yongdong Zhang; “Boundary Perception Guidance: A Scribble-Supervised Semantic Segmentation Approach”, The 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), Pages: 3663-3669, August 10-16, 2019, Macao, China (CCF A类人工智能国际顶级会议长文).
[17] Rui Zhang, Sheng Tang*, Luoqi Liu, Yongdong Zhang, Jintao Li, Shuicheng Yan; “High Resolution Feature Recovering for Accelerating Urban Scene Parsing”, The 27th International Joint Conference on Artificial Intelligence (IJCAI 2018), Pages: 1156-1162, Stockholm, Sweden, July 13-19, 2018(CCF A类人工智能国际顶级会议长文)
[18] Rui Zhang, Sheng Tang*, Min Lin, Jintao Li, Shuicheng Yan; “Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions”, The 26th International Joint Conference on Artificial Intelligence (IJCAI 2017),Pages:3427-3433,Melbourne, Australia, August 19-25, 2017(CCF A类人工智能国际顶级会议长文)
[19] Yuchen Guo, Guiguang Ding, Jungong Han, Sheng Tang; “Zero-shot Learning with Attribute Selection”, The 32th AAAI Conference on Artificial Intelligence (AAAI 2018), February 2-7, 2018, New Orleans, USA. (CCF A类人工智能国际顶级会议长文)
[20] Xiaohan Ding, Guiguang Ding, Jungong Han, Sheng Tang; “Auto-balanced Filter Pruning for Efficient Convolutional Neural Networks”, The 32th AAAI Conference on Artificial Intelligence (AAAI 2018), February 2 - 7, 2018, New Orleans, USA. (CCF A类人工智能国际顶级会议长文)
[21] Linghui Li, Sheng Tang*, Lixi Deng, Yongdong Zhang, Qi Tian; “Image Caption with Global-Local Attention”, The 31th AAAI Conference on Artificial Intelligence (AAAI 2017), Pages: 4133-4139, San Francisco, California USA, February 4–9, 2017 (CCF A类人工智能国际顶级会议长文)
[22] Lixi Deng, Jingjing Chen, Qianru Sun, Xiangnan He, Sheng Tang, Zhaoyan Ming, Yongdong Zhang, Tat Seng Chua; “Mixed-dish Recognition with Contextual Relation Network”, ACM Multimedia 2019, Pages: 112-120, Nice, France, 21-25 October, 2019. (CCF A类多媒体国际顶级会议长文)
[23] Rui Zhang, Sheng Tang*, Yu Li, Junbo Guo, Yongdong Zhang, Jintao Li, Shuicheng Yan; “Style Separation and Synthesis via Generative Adversarial Networks”, ACM Multimedia 2018, Pages: 183-191, Oct.22-26, 2018, Seoul, Korea. (CCF A类多媒体国际顶级会议长文).
[24] Lixi Deng, Sheng Tang*, Huazhu Fu, Bin Wang, Yongdong Zhang; “Spatiotemporal Breast Mass Detection Network (MD-Net) in 4D DCE-MRI Images”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2019), LNCS 11767, Pages: 271-279, Oct. 13-17, 2019, Shenzhen, China. (医疗影像处理国际顶级会议长文)
[25] Bin Wang, Guo-Jun Qi, Sheng Tang*, Liheng Zhang, Lixi Deng, Yongdong Zhang; “Automated Pulmonary Nodule Detection: High Sensitivity with Few Candidates”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2018), LNCS 11071, Pages:759–767, September 16-20, 2018, Granada, Spain. (医疗影像处理国际顶级会议长文)
授权专利:
[1] 唐胜、王斌、张勇东,一种基于涂鸦的弱监督语义分割方法与系统;授权日期:2021年9月7日,授权专利号:CN201910588880.1
[2] 唐胜、伍天意、李锦涛,基于上下文信息指导的场景分割方法与系统;授权日期:2021年4月27日,授权专利号:CN201811309249.5
[3] 唐胜、伍天意、李锦涛,基于克罗内克卷积的场景分割方法与系统;授权日期:2021年4月6日,授权专利号:CN201811309245.7
[4] 唐胜、张蕊、李锦涛,基于特征图恢复的场景分割方法和系统.;授权日期:2020年12月11日,授权专利号:CN201810664250.3
[5] 唐胜、张蕊、李锦涛,融合全局信息的场景分割修正方法与系统;授权日期:2020年9月11日,授权专利号:CN201710650525.3
[6] 唐胜、张蕊、李锦涛,融合局部信息的场景分割修正方法与系统;授权日期:2020年6月26日,授权专利号:CN201710650541.2
[7] 唐胜、肖俊斌、李锦涛,一种基于目标检测的大规模图像检索方法与系统;授权日期:2020年6月5日,授权专利号:CN201710574741.4
[8] 唐胜、李灵慧、张勇东、李锦涛,一种生成描述图像内容的自然语言的方法与系统;授权日期:2020年1月21日,授权专利号:CN201711265210.3
[9] 唐胜、张勇东、李锦涛、徐作新;字典学习、视觉词袋特征提取方法及检索系统;授权日期:2017年6月30日,授权专利号:CN201410287639.2
[10] 唐胜、李锦涛、张勇东、谢 呈;一种数字图像训练和检测方法;授权日:2013年3月6日,授权专利号:CN200910092710.0
科研项目:
[1] 国家重点研发计划项目,跨媒体*****技术,354万,2018/02-2021/12,课题负责人。
[2] 国家重点研发计划项目,融合多通道语境信息的类人智能感知机制与方法(2017YFB1002202),2017/10-2021/09,子课题负责人(85万)。
[3] 中国科学院,自监督视频深伪检测关键技术研究(E141020),80万,2021/05-2023/12,课题负责人。
[4] 国家其他任务,视频检测系统设计开发(E179029),159万,2021/07-2027/12,项目负责人。
[5] 国家其他任务,视频检测,80万,2021/07-2022/12,负责人。
[6] 中科院计算所创新重点课题,伪造检测软件加速和优化算法研发,250万,2021/06-2023/05,子课题负责人。
[7] 国家242项目,面向图片的特定信息识别技术研究(2020A077), 2020/08 - 2021/06,120万,项目负责人。
[8] 国家242项目,面向特定人物及场景的图片识别关键技术研究(2019A010), 2019/04 - 2020/04,110万,项目负责人。
[9] 国家863计划项目,异构媒体数据的关联与挖掘研究(2014AA015202),333万,2014/01-2016/12,课题执行负责人。
[10] 国家自然科学基金面上项目,基于稀疏表示和深度学习的大规模目标检测(61572472),78.4万,2016/01-2019/12,项目负责人。
[11] 国家自然科学基金面上项目,基于跨域迁移学习的网络视频检索技术研究(61173054),57万元,2012/01-2015/12,项目负责人。
[12] 国家自然科学基金面上项目,融合显式和隐含语义概念的视频检索技术研究(60873165),30万,2009/01-2011/12,项目负责人。
[13] 国家其他任务,大规模图像检索与识别系统(20157300),120.8万,2016/01 -2017/12,项目负责人。
[14] 北京市自然科学基金面上项目,基于稀疏表示的大规模移动视觉搜索技术研究(4152050),18万,2015/01-2017/12,项目负责人。
[15] 腾讯公司,图像语义自动标注研究,25万,2017/5-2018/4,项目负责人。
[16] 冰岛Videntifier科技公司,图像语义检测国际合作(Y505161000),20万,2014/08-2015/07,项目负责人。
[17] 华为技术有限公司,图像场景语义概念检测研究(YB2013080040),60万,2013/09 -2014/12,项目负责人。
[18] 三星通信技术研究有限公司,自动内容识别技术研究(4920125200),60万,2012/04-2013/03,项目负责人。
[19] 新华社,中国全球图片总汇富标签项目 (20125020),20万,2011/01-2011/12,项目负责人。
[20] 中科院知识创新项目,互联网新闻视频话题检测与关联分析, 10万,2007.8-2009.8,项目负责人(计算所首批百星计划)。
[21] 中科院计算所创新课题,面向互联网内容监控的视频分析技术(20076031),28万,2007.5-2008.4, 项目负责人。
获奖及荣誉:
科研获奖:
1、2019年国家自然科学奖二等奖,获奖项目为“互联网视频流的高通量计算理论与方法”。
2、 2020年北京市科技进步奖一等奖,获奖项目为“开放环境下数字伪造内容检测关键技术与服务平台建设”。
3、2018年中国电子学会科学技术奖(自然科学类)一等奖,获奖项目为“互联网视频的高效流式计算理论与方法”。
4、2017年中国电子学会科学技术奖(技术发明类)一等奖,获奖项目为“视觉大数据检索与智能分析关键技术及应用”。
5、2014年北京市科学技术奖一等奖,获奖项目为“大规模网络视频处理与内容分析关键技术及应用”。
6、2012年首届中国计算机学会科学技术奖,获奖项目为“大规模网络视频内容分析关键技术及应用”。
7、2006年北京市科学技术奖一等奖,获奖项目为“面向体育训练的三维人体运动模拟与视频分析系统”。
国际竞赛:
1、ACM Multimedia 2021多模态商品识别挑战赛,冠军。
2、ICCV 2019大规模长尾实例分割挑战赛,冠军。
3、2016年国际ImageNet大规模视觉识别挑战赛(ILSVRC),获视频目标检测和语义分割任务全球第三。
唐胜 研究员
研究方向:
所属部门:前瞻研究实验室
导师类别:博导计算机应用技术
联系方式:ts@ict.ac.cn
个人网页:http://people.ucas.ac.cn/~shengtang