中国教育在线
中国教育在线
北京大学彭宇新教授当选电气电子工程师学会会士(IEEE Fellow)
2025-12-03 16:01
北京大学王选计算机研究所
作者:

  2025年11月27日,电气电子工程师学会(IEEE)公布了2026年度晋升会士(Fellow)人员名单,北京大学彭宇新教授以其对跨媒体分析与细粒度识别的贡献(for contributions to cross-media analytical systems and fine-grained visual recognition),当选为IEEE Fellow。

  彭宇新,北京大学二级教授、博雅特聘教授,IEEE/CAAI/CIE/CSIG Fellow。

  主要研究方向为多媒体分析、计算机视觉、人工智能。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步奖一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然基金重点(2项)、北京自然基金联合基金重点、发改委专项等40多个项目。发表TPAMI、IJCV、CVPR、NeurIPS、ICML等ACM/IEEE Trans.和CCF A类论文160多篇,获最佳论文奖2次,包括国际多媒体领域的重要学术会议MMM 2019唯一最佳论文奖。连续4年(2021-2024)入选全球前2%顶尖科学家“年度科学影响力排行榜”和“终身科学影响力排行榜”。连续5年(2020-2024)入选爱思唯尔“中国高被引学者”榜单。入选ScholarGPS 2024年全球前0.05%顶尖学者近五年榜单。

  参加10届(10年)由美国国家标准与技术研究院(NIST)举办的国际评测TRECVID视频搜索比赛,均获第一名,参赛队伍包括斯坦福大学、卡内基梅隆大学、牛津大学等。成果应用于国家网信办、公安部、国家广播电视总局等重要单位以及华为、腾讯、快手、蔚来、美团、中国电信、中国铁塔等头部企业。担任IEEE TCSVT高级领域编委、IEEE TMM等期刊编委,培养博士生获中国计算机学会、中国电子学会等优博。

  彭宇新教授长期从事跨媒体分析研究,针对互联网大数据“管不住”和“用不好”两大难题,提出了跨媒体内容理解与生成的系统性解决方案。一是构建了“知识增强-粒度细化-运动感知”三位一体的跨媒体内容理解新范式,二是构建了“理解-推理-生成”闭环优化的跨媒体内容生成方法体系。提出了“弱监督图像细粒度分类”新研究方向,单篇论文谷歌引用1115次,被国际同行专家评价为“首次(first work)解决了无对象标注图像细粒度分类难题”、“取得巨大进展(made great progress)”。构建并发布了5个跨媒体数据集和评测基准,被斯坦福大学、麻省理工学院、卡内基梅隆大学、谷歌、微软等300多个研究机构使用,并发表TPAMI、IJCV、CVPR、NeurIPS等论文600多篇,引领跨媒体分析方向研究。

  近年来彭宇新教授的研究成果应用于快手、华为、阿里、美团、蔚来、腾讯、中国电信、中国铁塔、中国航天科工三院等12家头部企业,代表性应用如下:

  应用一:快手视频自动创作

  文生视频技术应用于快手视频自动创作业务,克服内存消耗高、帧率低、连贯性差等难题,计算开销降低10倍,在画面质量、动态表现、响应速度等方面技术领先。

  应用二:快手可灵AI试衣

  虚拟换衣技术应用于快手可灵AI试衣业务,根据用户提供的人物照片和选择的商品图片,自动生成整体效果自然、细节高度保真的换衣效果图。

  应用三:美团广告海报自动生成

  广告海报自动生成技术应用于美团APP,以人工智能技术代替专业广告设计师,大幅降低人力成本,提高了广告海报的美学质量。

  应用四:华为手机端侧大模型

  端侧视觉大模型应用于华为手机图库APP,在提升大模型精度的同时显著降低参数量,提升了大模型在智能手机等端侧设备上的部署效率,增强了华为图库的智能化图像与视频处理能力。

  应用五:阿里视频指纹识别

  视频指纹识别技术应用于阿里云视频DNA检索系统,在视频查重、视频溯源等核心业务场景实现规模化应用,在提升检索准确率的同时,降低了5倍存储成本和25倍计算成本。

  应用六:蔚来自动驾驶

  三维场景感知技术应用于蔚来自动驾驶业务,达到厘米级场景流速度预测精度,实现了障碍物预测、移动目标追踪和密集三维场景感知等业务需求。

  应用七:中国航天科工三院无人机控制系统

  端侧障碍物感知技术应用于中国航天科工三院无人机控制系统,在端侧无人机设备上部署,仅仅使用视觉信息实现了无人机自主避障和自主降落,为无人机的低空飞行提供安全保障。应用八:腾讯视频推荐系统

  跨媒体知识图谱技术应用于腾讯视频推荐业务,构建体育领域细粒度跨媒体知识图谱,并基于知识图谱预测用户偏好,实现大量视频的精准推荐。

  应用九:腾讯视频内容审核

  多模态内容审核大模型已应用于腾讯微信视频号,每日审核超过15万条用户上传内容,有害内容识别准确率超过98%。

  应用十:中国电信人员跌倒检测

  人员跌倒检测技术应用于中国电信天翼视联AI分析平台,实现学校、养老院等复杂场景中的实时在线多人跌倒检测。

  应用十一:中国铁塔中高点位监测

  中高点位多场景监测技术应用于中国铁塔视联平台,覆盖50种以上细粒度类别对象、4种模态(如可见光、夜视、红外等)监控场景,同时支持5种下游任务,精度和效率大幅提升。

免责声明:

① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。

② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。

相关新闻