
曾文军,微Y亚洲研究院高U领导团队(SLTQ成员,首席研究员,IEEE FellowQ西安交?微Y亚研院智能信息处理联合实验室MQQ密苏里大学、中国科技大学、西安交大、天z大学等多所学校博士生导师?990q毕业于清华大学?sh)子工程p,1993q和1997q分别获国圣母大学和普林斯大学电(sh)气工E硕士和博士学位。先后在国松下信息技术实验室、贝实验室、夏普实验室、Packet Video {公司工作?003-2016d苏里大学计算机科学系ln教授?014q加盟微软亚z研I。他对国际标准(ISO MPEG、JPEG2000 ?Open Mobile AllianceQ发展作出重大A献,发表了大量论文和专利q被q泛引用Qƈ有两部关于多媒体安全和社交多媒体的著作。他目前负责微Y亚洲研究院视频分析和理解的研发,为微软认知服务、微软云q_Azure 的媒体分析服务,Office、Dynamics和Windows Machine Learningq_提供技术。担任过多个IEEE期刊和杂志的副主~、多个IEEE国际会议 (如ICME 2018、ICIP2017{? 的大会共同主席或技术程序委员会d?/span>
2020q_疫情Ҏ(gu)着世界前行Q时间依然以往日的步伐不紧不慢地记录着q个星球的点滴。这一q尽如此不q_Q但U技早已融入人类的生z,像是科qȝ巨匠诺兰在电(sh)׃界里描绘的那P未来已来Q只是h们尚不自知?/span>
多年前,Zq在距离通信通话而挠墙;多年后,多媒体技术正成ؓ世界的主。不久的来Q作个星球的生命MQhcL时每ȝ行ؓ、甚臌n体机能都会成为科学技术乃臛_展趋势的深入d。譬如在某一时段内某一场景下某一人群的表现可以在视觉环境中被记录Q甚至细化到每一ȝ姿态识别,人机交互在三l乃臛_l空间中都将完美呈现。这qU式的脑洞大开Q恰如以色列历史学家瓦¯拉利所aQ这极有可能是人类的未来?/span>
本期的采访主角——清华大学电(sh)子工E系1985U校友曾文军Q现为微软亚z研I高领导团队QSLTQ成员、首席研I员Q就以这Lq般的案例,带领我们走进了他的科技世界?/span>
怀揣科技梦,从山区小城考入首都北京
与很多传l的理工男不同,曾文军n上既有着老派的研I气质,又有着新时代的q取情怀。这与他的个人经历密切相兟뀂换而言之,可以说他打通了学术界与工业界融合的ȝ二脉Q兼L两个领域的不同气c对U技研究的孜孜不倦和不懈q求Q既承自清华大学的z礼Q也来自于幼时的梦想?/span>
上世U?0q代Q在中国徏襉K的一个小城龙岩,有一个调皮的学生Q正让所在学校的老师头疼。“这个孩子极其聪明,是各种鬼点子太多,玩心太重……”然而,谁也没有惛_的是Q初二之前还上山摘果下河摔R的他Q初二之后收心向学,成ؓ“学”般的存在。在所在的省重点中学,他的考试成W几乎q年都是qW一?/span>
更让人没有想到的是,多年之后QhCq的曾文军,已然成ؓU学研究的“知名”h物,他带领团队在多个前沿U技的研I中斩获颇丰。就像儿时站在v边迎风而立Q想着有一天能在神奇科技的助力下遨游Q而今Q他不仅做到了,而且l发掘科技的潜力、l把它蕴藏的奇应用Chcȝ生活中?/span>
管成长在一个偏ȝ徏城Q但曾文军告诉我们:在他的家乡龙岩,家家都很重视教育。他的父母都是中学老师Q从在求学上进的x面命中感受到学习的力量。最l,他的高考成l不负众望,M地区状元的宝座?/span>
1985q_是教育改革的W一q_当时所在地的推荐名额(推荐也需要参加高考)仅仅有两个,曾文军就是其中的一个。从就一直敬仰清华大学的他,Ҏ(gu)理化的兴格外浓厚,加上一直怀揣着的科技梦,于是Q他毫无(zhn)念地选择了电(sh)子工E系Q“当时在我的认知里,无线?sh)三个字充满了科技感,而且实话实说Q在当时q也是非常先q的学科Q能够进入国家的尖学府学习梦想中的专业QU激动的感觉到现在都记忆Ҏ(gu)。”曾文军坦言?/span>
六年时光Q清华基本功受益l生
从山区小城到首都北京Q对于曾文军来说Q是人生中的一ơ重大跨。进入清华大学,带来的不仅是视野上的开拓,更让他深d感受C清华在学业传授和学术研究斚wU蓄的力量?/span>
辑ְ文有一句名a深入人心Q最有h(hun)值的知识是关于方法的知识。百q清华,对于教育的真谛更是驾d熟。如同曾文军在采访时所aQ在清华Q自Z息、厚徯物是我们_上的灯塔Q因材施教、注重实践则是行动上的指导方针。从实践中获得解决问题的Ҏ(gu)、在动手中提高应对的能力Q从大二开始进入实验室的曾文军Q至今对母校的这U“在实践中来到实践中厠Z的厚教学氛围印象深刻?/span>
在清华的W一q_曾文军在学校全年U的数学PK中进入“因材施教班”。这个班的目的,是要在短短几个月旉内学完一q的评。面对诸多数学高手,他在期终考试的时候依然取得了满分的好成W。“在清华Q因材施教的方式Ҏ(gu)其实q有很多Q这仅仅是其中的一个小案例Q却也因此让我徏立v对自w数理能力的自信Q激发出持箋不断的内驱力。?/span>
五年的本U学习,最后一q的毕业设计Q“实践出真知”是曾文军在清华大学六年时光的关键词。从一个个陌生的名词到一ơ次p|又重新开始,从无C不眠的深夜到甘愿牺牲的周末……曾文军跟着导师在实验室里将研究q行到底?/span>
在此期间Q他曑֏与了多个国家U技d目。在毕业的那一q进入清华的囑փl参与国家七五攻关项?囑փ计算机系l的研发Q从囑փ的采集、处理到昄Q从六层昄板的每一条线路的设计Q都需要自己全E动脑动手,在这样充满挑战的实践q程中,曾文军的专注力和耐力更加_进Q而且他的动手能力更是得到了训l,L了良好的研究习惯。这一切都成ؓ他日后科研攻关不断向前迈q的基础源泉。“其实,q样的实跉|会非帔R得。因为我们的背书是清华,才能以一个本U生的n份接触、参与到国家目中来。?/span>

1997q博士毕业时与导师Bede Liu 教授在普林斯大学合?/span>
怀揣着U技助力未来的梦惻I曾文军在以优异成l从清华大学毕业之后Q选择以全额奖学金q入国圣母大学l箋深造,后来又去了普林斯大学攻d? 师从数字信号处理领域泰斗Bede Liu 教授Q?Bede Liu 教授是美国工E院和中国工E院两院院士Q。众所周知Q普林斯大学对理论的要求非帔RQ很多学生去了之后都需要相当长的一D|间去适应。然而正是凭借着在清华大学学到的“童子功”,曾文军自w带着厚的清华科研风g普林斯顿的要求无~连接,在更Z格和pȝ的学习训l中游刃有余?/span>
“自Z息、厚徯物”,在每一个清华h的眼里,不仅是一句校训,更体现在一a一行中Q这与“行胜于a”的校风不谋而合。六q的清华时光Q至今想P曾文军感叹说Q其实是整个w心都潜U默化地受到了清华精的z礼Q这是终生受益的源泉?/span>
投n工业界,坚守研究初心
伽利略曾l说q:U学的真理应该从实验中和以实验ؓ基础的理Zd现。从二十多年前踏入职场,曾文军从工业界到学术界,然后又回归到工业界;他追随科技梦的脚步却从未停歇?/span>
1997q_是美国工业界q来d覆地变化的重要一q。博士毕业的曾文军,面对着全球亢奋的网l兴起和发展风潮Q在一番抉择之后,是全w心搞研I还是投w商业?最l他选择了一条折中的道\Q先后在国松下信息技术实验室、贝实验室、夏普实验室工作。虽然是在工业界Q但依然可以在实验室做研I。因为,他始l把U学探烦作ؓ核心q求?/span>
2001q_在一家圣C哥的独角兽创业公司,曾文军成为第一批在3G|络上做Ud视频媒体的先行者。l做研究的同Ӟ也在持箋参与行业国际标准{的制定?/span>
期间Q曾文军学以致用Q推q更多研I成果,对国际标准(ISO MPEG?JPEG2000 和Open Mobile AllianceQ发展作出重大A献。他发表了大量论文和专利q被q泛引用Qƈ出版了两部关于多媒体安全和社交多媒体的著作?/span>
值得一提的是,早在d期间便对多媒体安全领域非常关注的曾文军,一直保持着对行业发展的深入z察Q取得了丰硕的研I成果。特别是在数字图像水印方面取得的开创性进展,充分利用了hD觉系l的Ҏ(gu),优化了数字水印的不可见性和鲁棒性的q。论文发表后Q曾被引用过上千ơ?/span>
此外Q另一被业界瞩目的成果是他率先提Z视频讉K控制技术中格式兼容的新概念。解决了后向兼容性的挑战问题Q被世界视频~码标准l织MPEG4 的IPMP Q知识权管理与保护Q?标准采用。这个概念后来也被世界图像编码标准组lJPEG2000 的JPSEC安全标准采用。曾被引用过几百ơ,对业界发展生了深入影响。在由曾文军参与~著、Elsevier出版的著?Multimedia Security Technologies for Digital Rights Management Q用于数字版权管理的多媒体安全技术)中,q一技术和其他当时最前沿的数字版权管理技术一赯收录在列?/span>
对于行业国际标准的制定,曾文军的贡献更是功不可没。其中,׃d的HTTP streaming of JPEG2000 imagesQ美国专?,206,804 QMethods and systems for transmitting digitalimages Q数字图像传输的Ҏ(gu)与系l)Q提Z?HTTP 协议对大度的JPEG2000 囑փq行可~的式传输Qؓ JPEG2000 交互式协议标准铺q了道\。这一成果Q远q早于也使用HTTP 协议的MPEG DASH 动态自适应媒体标准的制定?/span>
数次跨界Q坚韧与探烦收获U研果
2003q_曾文军出人意料地从工业界q入学术界,M国密苏里大学Q教,成ؓ该学校计机pȝln教授。基于此前工作过E中的积累,曾文军对于角色的转换如鱼得水Q在q静的校园里Q教书育人的同时Q更适合搞大量的研究工作。埋首钻研十一载,对于曾文军来_U得上是厚积薄发?/span>
2014q_AI潮兴vQ曾文军最l决定要把多q的研究成果应用到实践中Q加盟微软亚z研I。就像他自己所aQ“衡量科研成果的最l标准,其实q是要看成果的应用h(hun)倹{在工业界的研究院里Q一斚w可以最快地捕捉到前沿的市场信息Q拥有更多的资源和数据加以挖掘和使用Q另一斚w也可以藉此有的放矢,q行更符合实际的研究。?/span>
的确Q与学校相比Q微软研I的研发拥有着l合优势。首先,气氛厚、强调实跉|H出的特炏V特别是注重研究成果对实际品的最l媄响和价值反馈,与一U市场更为吻合。第二,研究院设|专门的部门L察和考量全球一U市场对接,发现、分析、挖掘未来的ZQ从而让研究有的攄。第三,研究既要具备前瞻性,前引领行业Q相对独立和开放;又要从应用角度考虑到公司的战略决策、布局、品规划等Q从中找到共同点Q落实在产品上,展示出实际的影响?/span>
因此Q作为首席研I员Q曾文军坦言Q最大的挑战是全盘考虑、确立研I方向,如何从千丝万~的市场Z中进行筛选和抉择Q确定之后又要和公司的战略统一Q与团队把目标落实,良好地完成成果{化。“在此要特别感谢我的母校清华大学Q让我早早地L了良好的研究习惯和过的分析能力。得益于q样的基本功训练Q面对这U高屋徏瓴的布局Q才能更好地抓住Z。?/span>

微Y亚研院和高校计算觉学术研讨会
微Y亚洲研究院从1998q徏院至?已经发展成ؓ世界一的计算机基及应用研I机构,q将最新研I成果快速{化到微Y的关键品中。对研究q乎痴迷的曾文军Q目前负责微软亚z研I视频分析和理解的研发Qؓ微Y认知服务Q微软云q_Azure 的媒体分析服务,Office、Dynamics和Windows Machine Learningq_提供技术。同Ӟ他带领着团队着g下一代革命性技术的研究Q取得了一pd推动业界变革的创新成果,助力人类实现Ҏ(gu)来计的好构想Q改变着我们的现实生zR?/span>
譬如?019q?11月微软最大规模的q度 IT 盛会Ignite大会上,企业视频服务 Microsoft Stream 中展C的一Ҏ(gu)功能惊艳四Q从嘈杂视频中提取超清h壎ͼ效果显著越传统Ҏ(gu)。由曾文军带领的微Y亚洲研究院团队与 Microsoft Stream 团队共同研发的这一创新技术,x怽和谐波的语音增强模型 PHASENQ通过双流l构让降噪效果大q超q此前方法。无Z在多么嘈杂的地方录制视频Q该功能都能自动qo背景噪音Q让主要语音清晰地呈现出来。双模型结构与频域变换模块 FTB (Frequency Transformation Block)联动Q从而在AVSpeech+Audioset 数据集上获得 1.76dB ?SDR 提升Q超q了其他模型在该数据集上的表玎ͼq且?Voice Bank +DEMAND 数据集中Q四个指标均大幅过之前的方法,一个指标与之前Ҏ(gu)持^。目前,语音增强模型PHASEN已加入微软视频服务。该论文已被 AAAI 2020 接收?/span>
q随U技梦想Qn受研I的乐趣
在科技探烦的vz里Q探索未知,其乐无穷。科技最l的目的是造福q个世界。对于hcȝzȝҎ(gu)改变Q才是新U技研发的目的。“其实,每一个搞U研的h心里Q都有着q样的梦惟뀂”曾文军认ؓQ最l的应用实践效果才是考量每一Ҏ(gu)术的试金矟?/span>
早在四年前,他带领团队就开始关注视觉环境下的视频数据理解。利用计机视觉技术对场景中的行智能分析,通过视频信号分析用户的喜好和行ؓQ利用数据进行未来的预测。曾文军及其团队在该领域提出了一pd新的思\和方法,包括已{化入微Y产品的单摄像头多目标跟踪法 FairMOTQ多摄像头多Zl姿态估计算?VoxelPose {等Q这些算法在多个试数据集上都取得了良好的实验结果。在全球最有名的专业挑战公开榜上QFairMOTq箋八个月排在第一。ƈ且该成果已经在部分商领域开始得到良好用?/span>
目前Q以“h”ؓ中心的计机视觉技术在很多斚w都取得了显著q展Q但如何现有的深度学习模型和“h”这个主体的Ҏ(gu)相l合Q如何将人和环境存在大量交互两个d有机地结合v来,会是进一步探索的研究方向?/span>
作ؓ多媒体领域的技术专Ӟ面对着风v云涌的AI潮Q曾文军认ؓQ我们生zd一个由大量不同模态内容(文本Q图像,视频Q音频,传感器数据,3D{)构徏而成的多媒体世界中,q些不同模态的内容在具体事件和应用中具有高度相x。所以多媒体技术的发展和落地是必然势?/span>
“要把AI包括计算觉智能真正落地到有关痛痒的应用中Q模型的泛化性和自适应性能力的研究显得尤光要。MQ多媒体AI的发? 前途是光明的,道\是曲折的。但q正是做研究的乐。”不愧是U技达hQ即便在采访的过E中Q他也把研究的乐挂在嘴上。事实上Q也正是因ؓ有了像曾文军q样的科学家的坚韧与创新QhcL可以站在U技的高度上大胆畅想着未来的科q高度?/span>

1985U校友“辅导员”们?015U的学生们交活动后聚
采访的最后,曾文军饮水思源Q特别强调:清华_润清华人,正是清华的培L起了自己的科技梦想。“清华点燃了我搞U研的激情和热情Q也在我的一a一行中烙下了清华的印迹Q对此,我从内心感到骄傲和自豪。”曾文军感谢母校的教|让他得以在科学的大千世界中练出真功夫d现和探烦?/span>
2021q是清华大学110周年校庆Q曾文军在采访中为母校提前送上福Q“我会铭记母校的教导Q让我一生都受益无穷。祝清华,永远清芬挺秀、华夏增辉。?/span>
脚踏实地QԒ望星I。三十年前从清华大学走出来,曾文军坚守初心,W学砥砺Q不断创造和收获着累篏果Q我们也期待着他能在未来l大展n手、超过往Q让更新奇的U技造福人类、让更震撼的成果点亮世界?/span>
__________________________________________________
采访 | 乔元春、孙鹏鹏、吴梓栋、蒋丽婷、张雪辉、贺鲲鹏、林真如、胡铭中、谢楚楚、彭诗懿、肖振宇
撰稿 | 孙鹏?/span>