中国正在拥抱人工大潮Q不仅大学开始增设h工智能专业,中小学课堂也UL(fng)引入人工评?/span>
9?6日,世界人工大会丑֊前夕Q澎湃新闻记者在上v专访了卡耐基梅隆大学计算机科学学院教授邢?/span>Q清华物理系88U)。对于h工智能在中小学阶D늚教育Q他持}慎的态度。在他看来,初等和中{教育最主要的不是灌输知识而是培养思维Ҏ(gu)?/span>
邢LQ生于上P成长在北京。清华物理学毕业后ʎ修ȝ物学博士。随后进入加州伯克利学习计算机科学ƈ取得博士学位Q五q内成ؓ卡耐基梅隆计算机科学学院教授,专注于机器学习与l计Ҏ(gu)的相关研I?/span>

卡耐基梅隆大学计算机科学学院教授邢波接受澎湃新M访,谈h工智能。澎湃新闻记?吕啸 ?/span>
邢Lq是卡耐基梅隆大学机器学习pdpM任,国人工学会会士QAAAI FellowQ,国新泽西州立大学分子生物学与生物化学博士和国加州大学伯克利分校(UCQBerkeleyQ计机U学博士?/span>
谈到AI人才的培LQ邢波提C他所推崇的“解决问题”的思维Q你需要解决一个问题,而且q个问题要解军_“纯_V彻底、漂亮”。学生不能ؓ了证明一个理证明一个理论,也不能ؓ了做一个好看的工具而去做一个好工具。关注的重点应该是能不能解决具体的问题?/span>
一个一的研究人员应该“既能够大智若愚Q有淡定的劲儿,又敢于挑战权威成果,d拓新的题目,不随大流Q去做他认ؓ有h(hun)值的、甚x冷僻的题目”?/span>
专访中,他对人工在医疗领域的发展前景、h工智能的教育问题、h工智能科学家的创业现象做Z探讨?/span>
他提出,目前人工在医疗领域的展示很有误导性。医学h工智能与ȝ之间不是竞争关系而是协作关系Qh工智能能够极大地提升ȝ的效率,但绝对不是替代医生。部分计机U学家缺对d的敬畏和理解?/span>
在谈到目前的人工是否真的“智能”时Q邢波认为:U学是要解决问题Q而不是去辑ֈ某一U境界。对于“h工智能是不是需要跟人很像”这个问题,他个人持保留态度Q“即使h工智能以后跟Z像,也ƈ不会失去它的价值”。他认ؓQ应把h工智能跟人的形象和功能脱d?/span>
在他看来Q以目前的技术手D,甚至以可预见的技术手D而言Qh工智能不能跟人的智慧相提q论。与人相比,机器不会提出探烦性的问题Q没有“自知之明”,且十分依赖数据。但ZZ个机械的定义而言Q组合非常完,能耗、可靠度、稳定性,适应力,比Q何机械都要好?/span>
对于q年来的AI热潮Q他谈道Q由于媒体效应和其他兌事gQh们对AI的重视度提高了。但也许之前人工也很热,只是我们没有生活在那个年代,没有看到|了?/span>
他认为围被AlphaGo击|与卡斯帕|夫被深蓝击败,在技术上q不是一个本质性不同的事情。现在我们有了更强的计算资源Q有了一些算法上的进步,在完全有明确规则、确定结果,可预、过E透明的游戏里边,机器击|是一个非常可预见的结果,“以后Q何一个这L(fng)游戏中,人都会被击|”?/span>
至于大学教授创业Q他认ؓ不能一刀切,应该l予自由的环境,让大家找到适合自己的舒适空间?/span>
2016q_邢L在美国匹兹堡创立大规模机器学习^台公司Petuum。一q后Q该公司{w到由软银领投、尚珹资本(Advantech CapitalQ跟投的9300万美元B轮融资?/span>

邢L参加2018世界人工大会。澎湃新闻记?吕啸 ?/span>
以下内容Z访实录:
AIq课堂:教什么,怎么教,什么时候教Q这是个全球问题
澎湃新闻Q?/span>q年来,中国教育部有关于人工的一些规划,高校也开始推Z些h工智能的评。?zhn)是学界出w,对中国的AI教育有什么样的徏议?
邢LQ?/strong>AI教育q个问题实际上是个很普遍的问题,是个全球问题。大安q没有太x楚AIq种东西应该怎么教,应该什么时候教Q教什么。我看到q有一些很有趣的例子,比如说有些(地方Q甚至高中都已经开始教AI了,然后教的是一个深度学习的东西Q这都是很有意思的探烦。我个h觉得Q你看我们在教物理、数学或者其他科学的时候,我们可以看到学、初中、高中都教什么东西,对吧Q初中教的牛定律是三四癑ֹ前发现的Q已l搞透了的、完全了解的、毫无疑问的一些原则和准则Q然后越往上以后,教一些更加先q,更加隄Q然后甚x一些不太肯定的开攄问题。h工智能也应该大致重q样的逻辑Q应该先从基开始教Q从基础的数学原理,然后一些基本的法Q像决策?wi)、回归、递归{方法?/span>
所以说Q教育的整个原则和过E,需要做一个完整的思考,而不是ؓ了教育而教ԌZ去让大家了解而了解。我觉得在高{教育里面,臛_卡内基梅隆大学是一个比较成功的例子。我们学校在人工高端人才里是占据了相当大的垄断地位的Q因为我们有一个机器学习系。它在整个的教案和教学内定w面做q相当严肃和完整的思考,需要什么样的基课,需要什么样的中U课、高U课Q然后需要什么样的辅助课E、外延课E。这实际上都是有一套东西的Q而不是好像抓了几个东西以后给它捏h。这一Ҏ(gu)觉得值得各个学校来借鉴。当然这实现h有难度,因ؓ它需要比较强大的师资力量Q是一套比较齐全昂늚人马Q不太容易在每一个学校里面都能凑뀂但是我觉得q个思\是值得借鉴的?/span>
至于在本U、在中学Qh工智能是不是需要教Q怎么教,我个得还是应该}慎。因为我的感觉,对于初等教育和中{教Ԍ最主要教的不是知识Q而是思维Ҏ(gu)。你应该懂得逻辑思维能力Q懂得去挑战权威Q懂得自由思维Q或者是独立思维。这些东西其实用很多Ҏ(gu)Q很多教学内定w可以辑ֈ的,而不是靠l你灌一点专业知识。专业知识过时地很快Q有个几q的话基本上陈旧掉了。深度学习这个东西,比如说在三年前跟现在很不一P五年前更不一栗所以你现在学的东西q去了就忘掉。如果这里边没有一个通用的原则,没有一套整个的思维方式的话Q学了也是白学。所以我觉得q里边值得教育家好好地去重新想一惻I到底应该怎么来设计这个课E?/span>
澎湃新闻Q?/span>(zhn)个人只是花了五q的旉Q从机器学习入门到成为卡耐基梅隆大学的教授?
邢LQ?/strong>我比较幸q,q个q程比较快一炏V当然这有很多积累,q不是说那五q里Ҏ(gu)从零开始的。因为我原来的,包括本科里面物理的这些课E,包括后来生物学的训练都打下了基础。我觉得最主要的不是训l出多少Q我背诵下来或者记下来多少q个知识Q实际上是把q个思维Ҏ(gu)和研I方法训l得好。所以这个时候,像一台复印机造好了,你再往里面放东西,印v来就很快了。我觉得打好一开始的基础很重要,所以后来会很快。但我要是没有基从头开始学的话Q那我就不知道能学成什么样子?/span>
澎湃新闻Q?/span>(zhn)教qAI相关的课E,(zhn)觉得怎么h能当好AI老师Q?/span>
邢LQ?/strong>q个问题挺有意思的。很多老师都是以发文章的数目,或者你是不是够理论,是不是够工E,E序写的_好,以这些非常表面的标准来做一个评价和设计。我在我的教学中Q包括在教课中,也包括在培养博士生中Q都只有一个原则:我们是要解决问题。你需要解决一个问题,而且q个问题要解军_Ua、彻底、漂亮,可重复的话,其实你会发觉你既需要有好的数学手段Q而且要有好的工程技术。你要让它实现地非常好,q需要有分析能力Q能够把它解释清楚。然后你q得有各U各L(fng)q脏z能力,比如z数据、折腾机器。因Z的Q务是要把q个问题d解决?/span>
你说我是理论家也好,说我是实践家也好Q实验家也好Q或者说我位于这些之_其实价值是不大的,对不对?其实在解决问题的q程中,可能q些东西都会触及刎ͼ然后形成一个综合能力。在我的译֠教育里,会布|很多小型课题,然后让大家去动手设计Q就像我在卡梅的图模型课和高{机器学习课。那是很多学生和当今著名教授们发W一论文的地方Q很多h的第一论文都是在那个课上发的Q包括了一些甚臛_有名的教授和工业界精英?/span>
我的博士生们研究的过E中也是一P他们的课题永q都不是Z证明一个理证明一个理论,也不是说Z做一个好看的工具而去做一个好工具。而是x能不能把q个问题l解x。比如说我能不能诊断个病Q或者是我能不能把整个的一大段视频做一个有内容的、准地压羃ȝ。这个问题在那摆着Q然后你用各U各L(fng)手段L它做出来。这里面最大程度上杜绝了所谓的黑匣作业Q或者这U手工作坊式的调参。ؓ什么呢Q那些东西不会稳定,不会成ؓ一个品和一个成果。稍微换个hQ换一套数据的话,基本上就没有用了。所以这些原则一旦用q去以后Q他会自动地ȝ正研I面的很多偏差和一些误解,然后对自q要求׃提高很多。这是我在教育中比较坚持的一个特炏V?/span>
澎湃新闻Q?/span>一个合格的人工人才应该具备什么样的素质?
邢LQ?/strong>他应该对研究本n、对解决问题本n有一U热情,然后有一U投入的感觉Q有一U纯_的喜爱。就是他比较喜欢q个q程Q而不是非常功利地以结果ؓ导向。我觉得对于研究人员来说Q这一点很重要Q否则他很难坚持Q也很难投入长期的精力或者时间。所以这一Ҏ(gu)我对学生的期望?/span>
然后Q他要有比较强的合作_和沟通能力,q样他才能够集思广益,能够跟别人分享成果,也能够获得别人的分n。这对他的研I或对别人研I会生比较正的推动?/span>
人品上的话,我觉得还是应该比较E定吧Q不以物喜不以己(zhn)Ԍ有这么一U情怀。因为真正的U研实际上是艰苦的,而且是需要很多耐心的,也必能够扛得住很多q扰。比如说你的同事今年发了三篇文章Q三个比分都是第一Q你怎么办?你是不是能够有这个定力,坚持你这个看上去非常苦的或者是暗E的题目,是不是有q样的坚韧性,q个是很重要的?/span>
q有一点就是,我碰C很多学生Q教授,他们徘徊在极端的不自信到q于自信之间Q这个钟摆摆得非常的快,它达不到一个很好的E_性。有时候学了一点东西以后,q然感觉自己已l什么都懂了Q就开始生了相当大的自满情A。或者是非常地没有自信,然后完全不敢挑战现有成果或者是权威。反正就是要么过于自卑,要么是q于自满。我觉得有能力在q方面达C个^衡,既能够大愚,有这UE定的劲儿Q又敢于挑战权威成果Q去开拓新的题目,不随大流Q去做他认ؓ有h(hun)值的、甚x冷僻的题目,p样一个素质,我觉得对于一个一的研究人员是相当有必要的?/span>
在h工智能时代,数据应得C护,而不是无限制地被分n
澎湃新闻Q?/span>在历史上人工的发展几lv落,q几qh工智能又再度蓬勃发展Q?zhn)觉得是出于什么原因?
邢LQ?/strong>有好多原因。最大的原因可能是数据的U篏量有非常大的H破。由于互联网现象的生,以及信息U学或者信h知科学等技术上的突_现在获得数据能力比原来大了很多?/span>
获得数据的能力大大增Z后自然就有处理数据的需求。而处理数据的主要技术就是我们所谓的机器学习、统计学、模式识别这些技术。这些技术实际上都跟人工是相当接q的?/span>
然后Qh工智能也是趁着q个潮得到了更多的重视。当然也包括技术上的一些突_比如在硬件上有了更大的运能力,使一些原先功能还不够强大的算法得C比较大的提升。其实不能说是一个质变,人工其实q是量变。但是达C一定的规模以后Q它的一些表现让Z生了比较Ȁ动的预期Q就觉得好像跟h更像了?/span>
卡斯帕罗夫被p击|的已l是20q前的事了,我个为,其实在技术上Q它的意义跟现在围棋被AlphaGo击|相比q不是一个本质性不同的事情。只是变了一套新的算法,有了更强的计资源,然后在一个完全有规则的、可预测的、有定性,透明的一个游戏里边,q个机器击|了。这是一个非常可预见的结果,以后M一个这L(fng)游戏中,人都会被击|Q这没有什么?/span>
但是׃现在的媒体效应,各方面的一些关联事Ӟ把AI的重视度提高了。所以我觉得Q也许现在h工智能热也没有我们想象中的比原来更热。也许其实原来也很热Q只不过我们没有生活在那个年代,没有看到而已。这是我的一个猜,通过一些历史书我能够感觉到那个时候的Z对AI也是很有期待的。当旉个Herbert Simon——h工智能的ȝ之一吧,一个先行?他曾l预十q之内机器可以超qh了?/span>
澎湃新闻Q?/span>最q不只是在学界,包括在工业界Qh工智能也有很多相关的成果。?zhn)觉得最q的q一D发展是可持l的吗?q是说像p一P不久之后会沉寂,臛_淡出大众的视野?
邢LQ?/strong>目前有一个跟原来不一L(fng)区别。现在h工智能的发展有很多的工业界和资本的介入,q个大概是前两次AI高潮没有遇到q的。所以它可能会提供一个新的契机,使h工智能发展的动力和力度更强。至于是不是可持l,很难说。什么叫可持l?是一直在发展Q还是说能够辑ֈ某一个目标?q个我很隑֎预测?/span>
比如_我觉得像以深度学习ؓ代表的某一个技术流z话,现在当然产生了一个主导地位,但至于它能不能可持箋Q这个我不敢表示乐观。我觉得q只不过是技术的某一个方向,它会辑ֈ它的饱和点,然后会有新的技术长出来。所以从技术来讲的话,永远的冠军可能是没有的,会有不同的技术突破出来?/span>
至于AI的发展是不是能长期持l下去,我觉得要看情形。比如说Q以现在对h工智能这个学U和对它的h员有q样高的期许Q甚xq实际的这么一些预期的话,那我觉得它会造成一些失望。AI达不到现在这么多东西Q但是它q是能够产生一些相当有用的成果Q比如说像无RQ工业h工智能,或者在金融和智慧城市里的应用,它都会生这U渐q的持箋性的影响。但是这些东西,你也可以说它是h工智能推动,但它也是一个非常综合的、各斚w介入的一个结果?/span>
澎湃新闻Q?/span>(zhn)刚才也提到Q机器学习需要很多的数据。那现在是不是没有够的、高质量的数据?而且在数据公开的监方面似乎不是非常的CQ?zhn)觉得q些跟数据有关的问题是否是目前机器学习的一个瓶颈?
邢LQ?/strong>要这么来看,如果你说q个数据只是关于人的数据的话Q可能会有一个瓶颈,而且我觉得这是一个应该有的瓶颈。我个h认ؓQ个人的数据是应该被保护的,而不应该无控制地d享。因为某一些算法的拥有者,他从他的利益的角度,当然会宣告你们应该把数据都交l他Q然后他的法或者他的这个工兯l得更好。那他回馈给C会什么东西呢Q他应该把这个讲清楚。我觉得q里边不应该存在一个单向的、无限制的提供。所以有q样的制U是好事Qƈ不是限制着U学发展?/span>
从另一个角度讲的话Q我觉得人工现在的定义权和话语权q是掌握在一部分人手里。这部分人的兴趣Q甚至他们的着眼点是有很大局限的。有很多地方Q有很多数据Q甚臌没有被h工智能的学者和工程师重视。比如说我们有这么多大工业的数据、农业的数据、R床、引擎、交通……有很多q方面的大数据,其实都需要算法,或者需要h工智能、机器学习的手段d分析优化和预。这里边其实很多学者或者是工程师ƈ没有表现出强烈的兴趣或欲望。我觉得可能是因为活太脏了,或者是曝光度太低了Q回报太低了Q所以还没有产生_的关注。所以从U学U的发展来讲Q我觉得现在臛_是机会远q大于资源。不存在大家找不着数据的情况,有的是数据?/span>
澎湃新闻Q?/span>q年来,许多国家在h工智能方面有很多的进展和成果Q比如美国、中国、英国和Ƨ盟国家Q也包括日本。?zhn)觉得q些国家的工作做得怎么P成果和进展如何?
邢LQ?/strong>当然国是有它的相当强大的优势的。整个h工智能原创性的思维Q或者是拥有原创性思维的hQ我想绝大部分都在美国。这是因为美国的学术I气、文化氛围、包括资本的风格Q或者是政府的驱动、引|都是比较有利于,不光是h工智能,q有很多其他基础U学的发展。所以你会看到很多长效的、持l性的一些研IӞ甚至是有些很低调的、很艰苦的研I。欧z是有很好的人才的,但他们的资源可能不像国q么丰富Q所以出C很多人才的流动。我们其实有很多Q我自己的很多同事都是从Ƨ洲q来的,从d国、英国、法国来了很多。最q可能稍微好了一点,回去了一些。他们的问题体现在这个量不够大,但是水^是很高。他们的端学者其实是完全可以跟美国抗衡的。中国情冉|较复杂,体量很大Q然后整个大众的兴趣也很高,对于技术的接受能力、欲望也很强Q这是不错的。但是整个的原创性和q种持箋性的话,q有待观察。因为时间还是比较短Q所以基本上对国外的很多原创理论或者技术还是有很大的依赖,高端人才的数量可能也要少一炏V?/span>
日本有很多的应用场景Q也有很大的需求。比如他们的老龄化比较严重,在生产力上有很大的缺口。我觉得人工q一块潜力还是很大的Q而且日本的科研水q也是不错的。现在我觉得q很难说哪个国家很有优势、已l可以高枕无忧了。可能美国会有一定的优势Q其他国家各有所ѝ?/span>
澎湃新闻Q?/span>有h在问Q什么时候才能有通用AIQ?/span>
邢LQ?/strong>通用AI在学术界是一个jokeQ笑话)。我可以很严肃地Ԍq个概念q不严肃。首先什么叫通用AIQ这个定义就很不严肃Q而且从技术上Ԍ它的实践中基本上是不可能的。所以很隑֎讨论q个问题。与其展望或qL功能上无所不能的AIQ不如在工程原理上探讨构造上的通用性。就好像在机械工E中Q我们会在不同的地方使用标准化的通用的螺丝和螺母。一个飞机引擎可能要有几百万个零Ӟ但是不需要那么多U螺丝和螺母?AI研发当前的基本Ş态则是大家各自重复造轮子,造高度专一的算法。我们需要在大量AI实践中找到其中的最大公U数Q设计,刉通用的AI构gQ这是Petuum AI产品的一个基本原则?/span>
澎湃新闻Q?/span>有观点认Zh工智能在未来会取代h们的部分工作Q或者生一些社会问题,(zhn)对q个现象是怎么看?
邢LQ?/strong>M一个技术都会这样子。我们有很多工作都失MQ比如电(sh)报员和打字员。这些问题我觉得应该留给政治家或者社会学家去解决Q这完全不是人工U学家的d。我个h觉得应该把这些问题分开Q把C会问题和科学问题、技术问题分开来讲。在一L(fng)话,对于学科的发展和C会的发展是不利的。科学家应该负责解决问题。就像我们去发电(sh)Q电(sh)也有宻I?sh)也会伤人,也会造成资源不均Q有些地Ҏ(gu)?sh),有些地方有?sh)Q怎么办呢Q这个问题我觉得得靠C会Q尤其是政治家或者其他层面上的h士来解决?/span>
U学家不应该做恶Q他不应该去帮助恶h做事Q但是科学技术本w不是一个恶的事情?/span>
学者创业,应该其自然
澎湃新闻Q?/span>(zhn)是生物学博士毕业,Z么{行学了计机且专注于机器学习和统计方法?
邢LQ?/strong>我本U是物理专业Q然后学了生物,之后再学了计机。我没有预先设计好的逻辑Q只是根据当时的个h兴趣和学术上的专长来做不断的修整。我喜欢定量U学Q喜Ƣ比较严格的分析。本U物理学训练使我有了一些数学基Q到生物专业之后做了不少实验Q也U篏了数据,需要来做这U分析,但生物学不是非常重视定量的研I根{在学计机专业Ӟ我写了很多程序,发觉机器学习q门U学其实很有意思,它可以把数据用一U数学的Ҏ(gu)来做分析Q还可以写出E序来自动来执行Q甚x很多比较q泛的应用,所以就学v来了?/span>
澎湃新闻Q?/span>当时机器学习q不是一个非常热门的专业Q?/span>
邢LQ?/strong>不是一个热门专业,实际上是一个很冷门的专业。所以兴很重要。我觉得如果是先讑֥路径Q然后往前走的话Q其实有些功利。还是(应该Q敢于跟随自q爱好或者感觉去往前走会更happyQ可能结果会更加的……我不能说更好,但我觉得臛_不会让自己后(zhn)?/span>
澎湃新闻Q?/span>(zhn)在ȝ物学博士的时候,q念了一个计机U学的硕士,是这样吗Q?/span>
邢LQ?/strong>寏V那时候很多h都有q样的职业规划。多学点东西Q有备无(zhn),可以在求职或者个业生涯的发展q程中有更大灉|度。我也不能免俗,也做了同L(fng)事。只是学了之后我的兴更加强烈了Q觉得还是应该有更好的专业训l?/span>
澎湃新闻Q?/span>有h说?zhn)是个工作狂,一天工?2时。?zhn)普通的一天会怎么h度过Q?/span>
邢LQ?/strong>很普通啊。既然普通的话就C住什么内容了Q就是跟q_Z栗普通的话就是看看书Q听听音乐,然后跟家里h一块吃饭聊天,没有什么特D的地方?/span>
澎湃新闻Q?/span>但有很大一部分旉是拿来做U学研究Q?/span>
邢LQ?/strong>是,最q很忙,所以大部分旉会在工作上面。这是一个需要,是说我觉得有时候工作的是对这个h的时间或者精力有很大的要求。所以也得有办法L担这个压力。但是我觉得qƈ不代表你׃定要L弃生z质量,或者是走到一个非黑即白的地步。还是应该适当地去做一些^衡吧。包括我鼓励我同事也可能努力去认识到这一点,有必要去做一些调节。比如说我自q话,有几件事我是肯定要做的。比如说个h的健w我是要做的Q每隔一两天都要比较正规地去健n。跑步啊Q或者是做其他的事情。这是雷打不动的Q然后包括生zM惯,饮食也还是尽可能C持规律。我q是d需要有一定的q?/span>
澎湃新闻Q?/span>(zhn)现在是处于CMU的休假期间吗Q?/span>
邢LQ?/strong>所谓学术休假,是从学校里暂时dM事一个其他的工作Q不用在学校里面担QM的职位或者做M的服务。但是我的假期已l结束了Q我现在实际上是on leaveQ相当于从学校留职停薪,来全职地做公司的工作?/span>
澎湃新闻Q?/span>现在有没有带学生Q?/span>
邢LQ?/strong>学生q会带。这是美国大学制度比较灵zȝ地方。教授的旉其实很有Ҏ(gu),学生也有_的独立能力,臛_在我的组里,学生都比较能qԌ也比较独立。我一星期会在学校里跟他们沟通一天的旉Q来验他们的q展Q提供一些徏议,l出方向。我觉得博士其实应该这么带Q我在博士期间也q么q来的,跟导师的接触其实不是非常具体的、每天的接触?/span>
澎湃新闻Q?/span>你现在带了多个博士Q?/span>
邢LQ?/strong>我最高峰的时候大概有25个左右的博士生,那可能是全世界最大的一个h工智能研I组。现在减了不,可能大概?5个。但现在有一些要毕业了,当然也有新的学生要进来,正处在一个新陈代谢的一个过E中?/span>
澎湃新闻Q?/span>其实我们看到在美国,比如说像李飞飞老师Q包括?zhn)也在内,既来自学术界Q又与工业界保持着比较密切的联pR?zhn)觉得q样的模式对人工的发展有什么样的作用呢Q国内有一U观点,觉得大学教授创业是“压垮大学科研的最后一根稻草”,但美国其实是有这个传l,而且比例也挺高。?zhn)怎么看待U学家创业的现象Q?/span>
邢LQ?/strong>q方面我觉得应该其自然Q每个h有每个h的风根{其实这个创业只不过是自己学术的一个外延。比如说有一些事情,像我个h的话Q我在做一个公司是因ؓ我的那个研究辑ֈ了一定程度以后,它在落地和商业化q程中需要一定的规模Q需要大团队。那我觉得自己如果有能力获得资金Q来l箋做的话,也许能够对社会生更大的价倹{这是一个很自然的一个外延。所以我觉得不能Z创业而创业,大部分做的好的创业家或者去工业界的人,不是说ؓ了工业而工业,他实际上q是要解决问题。这个问题也怸部分可以用纯学术的方法来解决Q但是也需要工E的投入。那通常q个问题当它_大,_真实的情况下Q很多h会选择两条路结合v来走。这个我觉得然的?/span>
至于在国内,q个焦虑我也能承认,q里边一斚w是跟政策有关p,一斚w也跟个h能力有关pR就像我刚才讲的Q工业和学术的结合不是每个h都能做到的。它需要这个h有够的能力Q或者是有够的贯通力。我觉得有所长寸有所短,每个人都有自q长处。所以不一定就是说一刀切,好像要么是所有h都应该在学术界,或者所有h都应该只在工业界Q还是应该有自由。我觉得大学环境也好Q社会环境也好,一旦有了自׃以后Q大家就会自己去扑ֈ自己最舒服的空间。但是你如果是要用规则来规定的话Q我不觉得最后会有好的结果?/span>
人工跟医生之间是协作关系Q不是竞争关p?/span>
澎湃新闻Q?/span>(zhn)现在主要的_֊是在(zhn)的创业的公司Petuum上?
邢LQ?/strong>寏V这是一个更h战性的Q更隄一个课题?/span>
澎湃新闻Q?/span>Petuum是一个通用计算机的学习q_Q?/span>
邢LQ?/strong>Petuum的工作实际上有很多层的含义。在产品层面上,它是一个通用的、可在不同场景下重复使用的、标准化的机器学习的应用pȝ。它是^台加上工具库Q再加上数据处理功能的,高度模块化的软gpȝ。但它同时也包括了很多垂直应用,比如在医疗和工业刉方面的应用。值得指出的是QPetuum其实不是一个典型的“算法型“h工智能公司, 而是十分偏重底层操作pȝ的公司,在系l方面厚U薄发,p细作,pȝ和AI法两方q。现在很多中国,乃至国的h工智能公司很见到在pȝQ架构顶会发基础工作上的论文Q却要到处U自己是“^台”公司。没有底层,后端的基创新和长期投入(每个工作周期长达两三q_Q只在算法模型上到NIPS/ICML灌水h分,能生合|有技术优势的q_吗?除了在NIPS/ICML/CVPR/ACL上的强势表现QPetuum在过Mq中l参数服务器和桥接协议方面的H破性工作后Q又接连在系l顶会发表了叠加通讯理Q弹性资源调度,节点~程与数据流~程l合的新型动态深度学习框ӞZ“充分向量”和点对炚w讯的通用分布式机器学习深度学习框Ӟ机器学习自动q行化等多篇原创工作QPetuumpȝ的计效率,通用性,和可延展化远高于其他pȝ?/span>
澎湃新闻Q?/span>Petuum最q在AIȝ领域取得了一些进展,(zhn)之前也谈到目前ȝ中处存在q度诊疗的现象,(zhn)如何看待h工智能在ȝ领域的前景?
邢LQ?/strong>人工在医疗前景还是很大的。因为医疗是一个非怾靠数据来做决{的U学。而h在数据面前其实既有长处又有短处。长处是指h的智慧可以在数据中基于大量背景知识,发掘出比较细微且复杂状况或Ş式。但是hҎ(gu)据的处理速度很慢Q所以h工非常昂c机器学习可以作Zh工的一U补ѝ比如,它可以在可接受精度下把处理时间从一时变成一分钟甚至更快。如此一来,如果AI能够在h机结合的环境里,l医生提供辅助的提示或者徏议,可以提高效率和准确度。尤其是在远E医疗领域,在一些比较艰苦的环境中,例如ȝ数量不但就医需求很大的情况下,g和Y件资源都比较E~。那么h工智能Y件的应用可以大大的减少诊断的时间和成本。而且AI可以通过Z大量ȝ数据的训l,l合大批ȝ的实늻验,好比可以同时让多位ȝl一个病人看病?/span>
但是目前我个为,我们所看到的h工智能在ȝ领域的展C,实际上是一个很有误导性的展示。它l常都会被展C成“在某某比赛中h工智能算法检肝癌或肺癌的_ֺ高于了医生”。这是都是非常误导和不严谨的。因为它对于数据的假设,对于讑֤的假设,对于题目的假N是很大的。什么叫“对于的肝癌诊断高于?%”?q个诊断本n是个很复杂的概念Q你是说q张NҎ(gu)肝癌、没肝癌Q还是说q个肝癌的位|在什么地方?体积有多大?严重E度是几度?q些都是诊断的一部分。所以所谓的诊断癌,q高5%的精度,q个量本n׃是很严肃的一个测量?/span>
q就是ؓ什么现在的人工在传l或者在大部分的ȝ环境里还是受到排斥的Q原因)。它其实q没有解军_生的需要。它是计机U学家自己假讄一个理想的比赛状态。但是医生和ȝ之间是不比赛的,ȝ和医生之间是协作的。在看病的时候,你很见C个医生在比赛Q他们都是在协作。两人意见不同以后,讨论一下,l一一下,然后获得更好的结果。我觉得很多计算机学家缺乏这斚w的敬畏和理解。所以他们所定义的东西其实ƈ不准?/span>
所以Petuum在开发医疗品的q程中让ȝ介入C产品的设计环节里面。我们会问:ȝ到底需要什么?比如_ȝ你喜Ƣ读几百늚病例吗?q个大概他不喜欢读,但是你要不要dQ还是要ȝ。那不如我们把读的过E简化掉Q帮助医生把U篏的病例很快读出来Q把关键词、关键的现象Q关键的q程抽出来,ȝ出来。再比如Q医生愿意去写图像诊断报告吗Q这个太Ҏ(gu)间了Q写一半时Q一天只能写几篇。但是医生是不是要过目一下呢Q肯定是要过目的Q不能完全不。所以最后就变成一个品,是用机器学习的Ҏ(gu)来帮ȝ写出一个诊断报告,可能?0U钟或者是三秒钟的旉Q然后展C给q个ȝ。这个医生可以勾勾改改,或者是不改。这是一个无~的人机交互的环节,而不是说人工去跟ȝ比赛Q写的比ȝ更好Q这个概忉|w是非常误导的?/span>
而且作ؓ一个医疗YӞ我们提供的功能不是一个或两个功能。这个Y件本w可以包含、覆盖几癄病症Q它是基于一个大的知识库和大量的各种疄各种形态的数据。它q提供刚才我讲的那些所有功能,包括报告ȝ、报告读取、生ICD code, 做药物的推荐, 做死亡率或出院率的预。这些功能需要综合在一个Y仉面,q样医院才能采购。反之,假如一个医院所需的每一个功能都需要从不同地方C个YӞ最后有几百个YӞq样从商业角度是不可能实现的。所以我觉得现在人工在医院中的应用有很多的提升空间。只是似乎现在学术界q缺乏对q方面够的理解和敬畏?/span>
澎湃新闻Q?/span>所以在(zhn)看来,人工跟医生之间的关系是一U协作关p?
邢LQ?/strong>是一个协作关pRh工智能是极大提升ȝ的效率,然后帮助ȝ提高工作质量和整个工作的体验Q但l对不是L代医生?/span>
澎湃新闻Q?/span>你们公司的Med目是关于电(sh)脑医生,是你刚才所说的那个吗?
邢LQ?/strong>对,我们的PetuumMed是q样一个东ѝ这个电(sh)脑医生里面包含了大概20来种功能Q覆盖了一癄左右的疾病。在q里Q^台或者系l的功能׃现出来了。因不是在训l一个YӞ也不是训l一U算法。它可能包含了几十种甚至上百U算法,而且是训l在不同的数据上。你怎么让它能够共存Q怎么能够在一个机器里面同时跑q么多东西?软g之间怎么来自由搭配组合?q里包含了一个比较工业化、正规化、标准化的Y件工E的概念。它不是调算法、调参数Q获得一个高的比分或者竞赛。这实际上是提供一个专业的软g产品Q可以完全离开开发者之手到ȝ的手里自由地使用Q就像用微软的office或者Excel软g一栗而且它功能是齐全的,有一套菜单和一个库Q让你去使用各种各样的功能?/span>
q就是目前在人工的研发过E中相当~少的一U理忉|者风根{基本上Q大安是用一个算法,调个参数Q在某个数据集上获得了一个好的比分就大功告成了,开始宣布,开始高调地做PR了。但那些东西在最后的应用q程中很多都会出现问题。所以Petuum其实把h工智能的q程定义成一个完整的软g工程的概念,从原始数据的处理到算法的设计和调_然后到基设施Q包括操作系l和数据库,虚拟机的׃nQ相互共存的q程和流E,都要设计出来。所以Ş成一个像水U或者一个标准化q_的概念,像是在土木工E中扚w建房一L(fng)?/span>
澎湃新闻Q?/span>Z么会选择ȝ领域Q?/span>
邢LQ?/strong>有好几个原因。一斚wCMU旁边有美国比较突出的一个医疗机构,叫UPMC匹兹堡大学医疗中心,它有很好的资源和d环境。其ơ,d问题是不能糊弄的Q它是一个关于h的生ȝ问题Q是一个很严肃的问题。所以它对h工智能提Z一个最好,也是最有h(hun)值的挑战。如果解决的话是能够真正产生价值的。然后它也达C一个比较有效的一个,是use case。我们在做这个系l,最后需要展C它的功能,看它的灵zd、解决问题的能力、可适应性和通用性等。在d里面Q问题是包罗万象的,例如刚才我讲的例子里面包含了自然语言处理、图像处理和动态数据处理;它还是多媒体Q因为各U数据都会同时进来。所以医疗不是一个非常单U的、简单的刯问题Q或者单U的聊天机器人的问题。把q些揉v来以后其实是一个相当大的技术挑战。如果我们能把这个问题解决了Q再换到其他场景d其他解决Ҏ(gu)的话是由难入易。我自己的研I理念一直是由难入易Q我们是先选最隄问题做,再去化,Lq,而不是先L最低的东西。我觉得q是不同的风根{所以,ȝ领域Ҏ(gu)们的团队和工作都是很好的训练Q对我们pȝ也是一个比较好的展C?/span>
澎湃新闻Q?/span>跟?zhn)之前有生物学斚w的背景有兛_Q?/span>
邢LQ?/strong>当然也有一定关pR我个h对医疗这斚w是比较喜Ƣ的。我觉得q是一个对C会价值比较大的问题?/span>
澎湃新闻Q?/span>对于我们目前拥有的h工智能到底是不是真正的智能,很多人有不同的观点,甚至有些观点觉得现在的h工智能只不过是一U统计学。目前的人工有没有达C心目中对于智能的定义Q?/span>
邢LQ?/strong>Z么要呢?我觉得这个讨论本w就偏离了这个科学。科学是要解决问题,而不是说需要去辑ֈ某一U境界。就像你做数学也好,做物理也好,要么是了解真相Q要么就是去解决问题。如果做研究只是Z像hQ那我觉得这本npM研究的目的。至我个h是不以这个ؓ目的来做研究的。我个h甚至不是很喜Ƣ“h工智能”这个词。原来这个专业叫做机器学习,q实际上是一个更专业的词。它把“h”这个字L了,而以题目本n来定义这个学U。它是ؓ了用机械的方法来学习数据中的一些内宏V?/span>
其实q是一个很传统的科学。在早期Q比如物理学早期Q开普勒分析W谷的行星运行的观测数据来获得轨道方E,其实p机器学习很像Q分析数据之后获得一个方E。后来更q代的机器学习的内容也是q样Q通过原始数据来获得一个数学方E,然后用这个数学方E来做预。就像在行星轨道里也可以预测行星的位|一P我们也可以预你的股,或者你的健P或者你的个人兴在下一个时间点上会有什么样的展C。所以这是一个用不同的方E对数据q行拟合的过E。至于机器学习与人工的关p,我觉得机器学习是获得人工的一U手Dc当然h工智能还有其他的Q预以外的功能。比如说了解思维q程Q了解数据背后的意义。但是h工智能是不是需要跟人很像?我个人持有保留态度。即使h工智能以后跟Z像,也ƈ不会失去它的价倹{h和机器就像马和火车,q两者不是在执行同一个Q务。就像我们说Q子非鱼Q焉知鱼之乐 ?马也有马之乐Qh有h之乐Q自然万灵都有它们的心智Q而对于AI讑֤Q它们的d和功能要Ua的多Q也应该Ua。所以我觉得用Q务或者问题来定义q个学科会对它的发展更有利?/span>
从技术角度讲Q我觉得人工以目前的技术手D,甚至以可预见的新技术手D늚话,在很大程度上不能跟h的智慧相提ƈ论。这两者不是一回事。比如说Q计器数学题过了hQ你会觉得它智慧吗?q不是一个赛道上的事。h是不跟机器来比这U事情的?/span>
有几件事机器是做不到的?/span>
机器不会提出探烦性的问题Q但人最大的长处不是解决问题而是提问题。真正的好学生是会提问题的,出题永远比做题要难?/span>
q有Q机器很难了解它不知道的东西Q它多知道它知道什么。但像我们都知道我们不知道什么,臛_有智慧的人知道他不知道什么东西,是有自知之明的。机器好像很有自知之明Q它不会说这个事我不知道Q更不会M动发现自׃知道什么?/span>
q有一点就是机器很依赖数据Q小数据里面的机器学习是很困难,非常不稳定的。而对于h来说Q大概一个例子就可以把东西学会,一张图看一遍就够了。其他还有一些细节的具体问题Q工E上的问题就更不用说了?/span>
ZZ个机械的定义而言Q他的组合是非常完美的,他的能耗、可靠度、稳定性,适应力比M机械都要好。所以我觉得Q不妨把人工跟h的Ş象和功能q开比较好。要看书Q就发明一个能看书的机器hQ要dQ就发明一个能d的机器hQ要既能看书又能dQ又能够做其他事情的话,发明这样一个机器h。但千万不要说它好像已经跟h很接q了。h能做的事很多Q实际上?/span>