近日,新加坡国立大学电机与计算机工程系寿政博士(Dr. Mike Shou)荣获首届“教务长创新讲席教授奖(Provost’s Innovation Chair Professor Award )”,其研究项目“AI赋能的视频智能与自动化(AI-powered Video Intelligence and Automation)”同时摘得“创新创业奖(Innovation Venture Creation Award)”。这些荣誉,彰显了寿政博士在科研领域的创新性研究以及这些研究成果在现实世界中的应用与影响力。
作为新国大重庆研究院“311”项目的毕业设计指导老师之一,寿政博士以学术的深度与教育的温度,为学子们搭建起探索未知的桥梁。
让AI成为“导演”
“如何让AI更好地理解视频、创作视频?”这是寿政博士探索的核心命题。他的研究聚焦于计算机视觉与深度学习,重点开发用于视频理解与生成的智能系统——让AI成为视频的“译者”与“导演”,延伸技术的想象力。
寿政博士在多模态视频AI领域取得了一系列具有重大现实影响的突破。他主导研发的7款开源软件在GitHub社区广受认可,具有广泛的应用价值。此外,他开创性地推出了用于 GUI 自动化的视觉-语言-动作模型ShowUI,能够通过控制键盘和鼠标,执行用户指令,实现工作流程自动化,显著提升工作效率。该成果在AI领域的国际顶级会议NeurIPS 2024 “开放世界智能体研讨会”上荣获“杰出论文奖 ( Outstanding Paper Award )”,其模型在HuggingFace平台的下载量已突破24万次。
科研“AB面”
翻开寿政博士的学术履历,是一条由热爱与实践铺就的青年学者成长轨迹。
2014年,他带着对视觉世界的好奇与热爱,赴哥伦比亚大学读博深造。博士毕业后,他的足迹从Facebook的工业实践,迈向新加坡国立大学的学术讲台。在Facebook,他作为AI研究科学家,参与搭建视频智能平台;在新国大,他作为青年教授,创建Show Lab实验室,带领团队在多项国际赛事中折桂。除此以外,他还入选新加坡国家研究基金会学者,跻身福布斯“30 Under 30 Asia”精英榜,担任多个国际顶级会议的领域主席。
在寿政博士看来,教授这个角色具有“AB面”:A面,是传统意义上,传道授业解惑的老师;B面,则是需要从0到1搭建自己研究团队的“创业者”。教学相长,从单点深耕到多领域统筹,寿政博士实现了深度与广度的平衡:“与不同的学生一起探索各种课题,让我得以在短时间内掌握各个相关领域的最新技术。这种成长是飞速的。”
寿政博士观察到,喜欢做科研的同学心中总是住着两个“打架的小人儿”:一个疯狂输出灵感,另一个又不断提出质疑。“打架之后最重要的不是停滞,而是要想出方案把问题解决好。”他常常鼓励学生:在研究中寻找答案,在实验中找到真知。于是,他指导的311项目学子,从对科研的懵懂,到逐步掌握方法,渐入佳境,从“学习者”渐渐成长为“研究者”。
2025届311项目学生刘成、陈丹泽,在寿政博士指导下,先后以共同一作、二作的身份,在计算机领域国际顶级会议NeurIPS、ICCV (Oral Presentation, 录取率仅3.3%) 发表论文。
科研之外,寿政博士始终重视学术社群的建设——他不仅在社交媒体分享自身的科研经验,同时也致力于为科研新人搭建交流的平台。寿政博士曾写道:我要记下自己的经历,希望能帮助到像我当年一样初出茅庐的科研新人。如今,他用行动践行着这一承诺——以科研创新,以教育传承。
参考资料:
[1] NUS Electrical and Computer Engineering News & Highlights: Innovation Venture Creation (IVC) - Provost’s Innovation Chair Professor Award
[2] 将门创投微信公众号专访:《新加坡国立大学助理教授Mike寿政:激活生命的火花,生命奇旅即刻出发》