从「天才少年」到被迫「追赶者」:诺奖得主、AlphaGo之父Demis Hassabis眼中的AI未来
谷歌 DeepMind 现任首席执行官 Demis Hassabis 过去常常在午夜到凌晨 3 点之间完成一些最有成就感的工作。他称自己为“夜行者”,独处时阅读科学论文,提出新想法,并进行简单的思考。
现在,哈萨比斯的清晨工作时间已经变得“不够”。他的许多团队成员在硅谷的谷歌总部工作,那里的上班时间比伦敦早八个小时。因此,他的视频会议经常持续到当地时间的第二天。 “大约 18 个月前,我的睡眠时间表仍然很好,”他若有所思地说。随着谷歌将 DeepMind 和 Google Brain 合并为 Google DeepMind,哈萨比斯也被任命为该部门的负责人。从此,宝贵的安静时光不复存在。
这是一个巨大的责任。尽管谷歌多年来一直在谈论成为一家人工智能优先的公司,但当前的生成式人工智能热潮是由 OpenAI 在 2022 年 11 月推出 ChatGPT 引发的。技术转化为实际产品后,谷歌现在被迫与无数其他公司竞争,包括 OpenAI 和 OpenAI 合作伙伴微软。
Google 重点关注 Gemini,这是一种大型语言模型 (LLM),可支持 Google 搜索“AI 概述”摘要、起草 Gmail 电子邮件等。 Gemini 还取代了 Google Assistant,成为 Android 上的默认语音 AI。然而,Gemini 还无法取代 ChatGPT 成为领先的 AI 聊天机器人,后者具有内置搜索等新功能英语学习重要性,并且正在与 Google 进行更直接的竞争。谷歌的一些人工智能产品发布也变成了公关噩梦,暴露出明显的缺陷,比如“建议用胶水把奶酪粘到披萨上”。谷歌愿意传播可能出错的AI,意味着其早期更为谨慎的态度已经发生。在 ChatGPT 表示当前技术的不成熟不会阻碍其采用之前,这是一个明显的转变:“坦率地说,我从来不相信社会可以容忍如此多的幻想,但事实就是如此,”谷歌 DeepMind 首席运营官莉拉·易卜拉欣 (Lila Ibrahim) 说。
尽管如此,谷歌仍受益于其竞争优势:只需点击一下即可让大量人使用人工智能技术。谷歌 DeepMind 产品副总裁 Eli Collins 表示:“目前,每一款拥有 10 亿用户的谷歌产品都集成了 Gemini。” “我们有9个产品,用户超过10亿。”
正如哈萨比斯所说:“事实证明,我们现在是谷歌的发动机室。”然而,Google DeepMind 的使命远不止于此。与OpenAI、Anthropic等公司一样,致力于实现通用人工智能(AGI)。尽管 AGI 的确切定义各不相同,但业界一致认为 AGI 涵盖的领域比目前更广泛。 20 多年前,肖恩·莱格 (Shane Legg) 建议将 AGI 作为本·戈策尔 (Ben Goertzel) 所著的一本书的书名,从而普及了这个术语。
现在,作为 Google DeepMind 的首席 AGI 科学家,莱格将 AGI 定义为“在人们通常可以执行的认知任务中至少能够与人类能力相匹配的东西”。哈萨比斯对于实体(不一定是谷歌)何时实施 AGI 留下了很大的余地,他说,“10 年内有 50% 的机会”,但也说,“如果发生得更早,我也不会感到惊讶”。
哈萨比斯是一个谦虚而善良的人,说话轻声但很快。他一生取得了伟大的成就,最近与他的同事 John Jumper 因在 AlphaFold 上的工作而获得了世界最高荣誉——诺贝尔奖。 AlphaFold 是人工智能辅助蛋白质研究的一项突破,可能会彻底改变药物发现。
尽管如此,哈萨比斯的职业生涯正在进入一个充满挑战的新阶段。多年来,他一直受到人工智能解决人类最大挑战的潜力的启发,这是他和谷歌共同的愿景,这使他能够以极大的自主权追求这一目标。但现在他必须将这一点与不断增加的压力结合起来,不断引入新技术并保持产品的相关性。成功将取决于他平衡科学理想与商业现实的能力。
我十月初去的时候,经过几天的毛毛细雨,伦敦的天空已经放晴,阳光洒进会议室。哈萨比斯向我解释了他如何努力确保 Google DeepMind 工作场所没有硅谷特有的那种密不透风的氛围。气氛。
谷歌DeepMind独特的办公室以“交流电之父”尼古拉·特斯拉命名和装饰,并向世界第一位程序员阿达·洛夫莱斯、“人工智能之父”艾伦·图灵等科技名人致敬。 ,毫不奇怪;还有对哲学家巴鲁克·斯宾诺莎和路德维希·维特根斯坦的致敬;还有一个以英国小说家玛丽·雪莱的名字命名的,她最著名的作品《弗兰肯斯坦》讲述了 200 年前人工智能出错的故事;还有一家以科幻作家艾萨克·阿西莫夫命名的咖啡馆,阿西莫夫在1942年提出了机器人三定律——第一条是“机器人不得伤害人类,也不得因不作为而造成伤害”。人类受到伤害”。
他们的图书馆藏有各种主题的纸质书籍,哈萨比斯对物理学家 David Deutsch 1997 年出版的关于量子理论的书《现实的结构》特别感兴趣。图书馆还拥有科技风格的艺术品,包括大堂的两个巨大的玻璃纤维多面体。根据侧面的标语,这些结构由英美雕塑家安东尼·詹姆斯创作,旨在“赋予数值计算的抽象美以硬朗而闪亮的触感”。
他说,这种多学科的氛围反映了哈萨比斯的多元化兴趣,涵盖“哲学、艺术和人文学科”。 “在价值观和社会方面,我也有同样的感觉。我觉得世界需要投资它想要的人工智能。” ——不仅仅是一百平方英里的加利福尼亚州。”
游戏是影响哈萨比斯的另一个重要因素。哈萨比斯 1976 年出生于伦敦,父亲是希腊裔塞浦路斯人,母亲是新加坡人。年仅4岁时,他就在国际象棋锦标赛中击败了父亲和叔叔。 8岁时,他通过参加国际象棋锦标赛赚到了足够的钱来购买他的第一台个人电脑;后来,他拥有了一台 Commodore Amiga 500,这台电脑至今仍深深印在他的记忆中,给他留下了深刻的印象,以至于他们已经从 Google 的其他部门招募了一位联合创始人。
17 岁时,哈萨比斯开始专业开发视频游戏,其中包括一款销量数百万份的游乐园模拟游戏。 1997年,当他从剑桥大学计算机科学专业毕业时,IBM的国际象棋计算机“深蓝”击败了世界冠军加里·卡斯帕罗夫。哈萨比斯很着迷。但他说,这一具有里程碑意义的时刻也是“一个奇怪的死胡同”。深蓝是所谓专家系统的一个例子,该系统是为国际象棋大师而生的,但无法接受训练来玩其他游戏,更不用说执行其他类型的工作了。
哈萨比斯发现他对另一种人工智能方法感兴趣:神经网络。通过模仿人脑的工作方式,基于该模型构建的软件可以学习像人类一样做很多事情。该技术一直受到计算能力的限制,但哈萨比斯坚信,随着超级计算机变得更加强大,神经网络可以取得巨大进步。
DeepMind 于 2010 年成立时,这家初创公司非常低调。最初的网站只有一个标志,没有其他内容。在早期,该公司开发了可以玩 20 世纪 70 年代 Atari 视频游戏的软件,并不是因为世界需要计算机来玩 Atari 游戏,而是作为开发能够自行找出规则和目标的 AI 的起点。如果没有将它们编码进去,需要花费很大的精力。(旧的 Atari 游戏卡带仍然堆放在 Google DeepMind 游戏室中。)
在破解《Space Invaders》和《Arkanoid》之后,DeepMind 将注意力转向了更大的挑战:围棋。这款已有 2500 年历史的棋盘游戏非常复杂,以至于许多人认为计算机可能永远无法掌握它。 2016年,AlphaGo软件击败了传奇围棋大师李世石——这是人工智能历史上比击败卡斯帕罗夫更伟大的时刻。第二年,出现了一个名为 AlphaGo Zero 的新版本。它可以自己学习成为更好的围棋棋手,而无需使用人类棋局数据进行训练。这是人工智能的又一重大进步,它能够与人类竞争。以同样的方式学习,但速度更快。
然而,DeepMind 作为一家独立公司的短暂生命很快就结束了。谷歌于 2014 年 1 月价格4 亿至 6.5 亿美元的价格收购了这家初创公司——与 OpenAI 目前 1,570 亿美元的估值相比,这个数字微乎其微,但在当时却是一个不错的数字。 。当时,投资者对人工智能并不乐观,作为一家初创公司,“筹集 1000 万美元非常困难,”哈萨比斯回忆道。他因共同致力于开发人工智能而结识了谷歌联合创始人拉里·佩奇和谢尔盖·布林。
DeepMind 的首批员工之一、现任 Google DeepMind 高级总监 Helen King 表示,出售给谷歌“意味着哈萨比斯不必一直花时间与投资者交谈”。 “他可以专注于推动研究向前发展。”
随着 AlphaGo 与李世石的比赛取得进展,哈萨比斯的想法转向了人工智能研究,涉及比游戏更实质性的内容。 “在我看来,下一步是走出实验室并将其应用于现实世界的问题,”他说。 “蛋白质折叠是我的首要任务。”确定蛋白质如何折叠成 3D 结构可以为药物发现和其他生物过程提供见解。技术领域提供了关键的见解,但这是一个非常艰巨的过程,在数十亿种可能性中只识别出了大约 100,000 个这样的结构。一位 20 世纪 90 年代的大学朋友在他的脑海中植入了人工智能可以提供帮助的可能性,当时他们在酒吧玩桌上足球时会痴迷地谈论人工智能。
DeepMind 发起了一项自动化这一过程的计划,并将其命名为 AlphaFold。 AlphaFold 的第一个版本赢得了 2018 年两年一度的蛋白质预测竞赛,这对于生物技术和人工智能来说都是一个更加非凡的进步。这也证明 DeepMind 以研究为先的文化可以在谷歌内部蓬勃发展。 Jumper 在写完关于使用机器学习进行蛋白质预测的博士论文后加入了 DeepMind,他在 2021 年告诉我,在那里工作“就像每天参加人工智能会议一样”。
今年5月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)邀请哈萨比斯在谷歌I/O开发者大会上登台。这感觉像是一个姗姗来迟的举动(哈萨比斯当时已经在谷歌工作了十多年),但时机非常完美,因为哈萨比斯的工作很快成为公司未来的核心。
哈萨比斯穿着他标志性的蓝色衬衫,戴着蓝框眼镜,发布了一段视频,展示了“Project Astra”,这是谷歌针对下一代人工智能代理的实验愿景。 Astra 由 Gemini 提供支持,设计用于在智能手机或智能眼镜上运行。
在某些方面,这感觉像是一种竞争的必然结果:如果谷歌不发明世界上最好的带眼睛的人工智能助手,其他人就会发明。 OpenAI 已经预览了类似的 ChatGPT 功能,包括可以解决手写数学问题和根据面部表情读取人们情绪的功能。即使是苹果公司,尽管对人工智能采取了谨慎的态度,但也在为 iPhone 提供更多的相机辅助智能。
然而,哈萨比斯告诉我英语学习重要性,他“深度参与”了 Astra 的开发,但他所做的不仅仅是构建一个更智能的人工智能助手。教软件了解周围环境也是Google DeepMind实现AGI的关键。他说,要让计算机像人类一样思考,“你不能只生活在语言和数学的世界中。你必须了解物理世界。”
仅仅关注 AGI 何时到来会低估 Google DeepMind 和其他研究机构已经取得的进展。例如,人工智能已经在理解多种语言方面击败了人类,这是谷歌 20 多年来一直热衷的话题。 Legg表示,一名优秀的法学硕士“可以讲100种语言,并且非常流利地讲30种或40种语言。据我所知,没有人能做到这一点。”某些版本的 Gemini 现在可以说多达 102 种语言 多种语言的对话,包括英语、法语和西班牙语,以及科萨语、马拉地语和乌尔都语等。
无论距离实现AGI有多远,谷歌DeepMind都在推进与谷歌直接利润无关的潜力巨大的研究项目和机会。 2021年,该公司成立了一家名为Isomorphic Labs的公司,将AlphaFold技术商业化,由哈萨比斯担任首席执行官,谷歌DeepMind首席商务官科林·默多克担任总裁。 Isomorphic Labs 目前拥有 150 名员工和独立的办公空间,专注于加速药物发现和开发,为 Google DeepMind 提供了另一个接触物理世界的机会。
此外,Google DeepMind 研究人员正在致力于解决现实世界挑战的其他项目:GraphCast 使用 AI 在不到一分钟的时间内生成准确的 10 天天气预报。 GNoME 已鉴定出 220 万种新无机晶体,其中包括 38 万种稳定晶体,可用于制造从电池到太阳能电池板等各种产品。他们与洛桑联邦理工学院瑞士等离子体中心合作开发了 Torax,以帮助预测如何控制核聚变所需的高于太阳的温度。
“我们拥有世界上一些最好的聚变专家、生物学家和材料科学家,”研究副总裁普什米特·科利 (Pushmeet Kohli) 说。
这些努力的范围正是时任首席执行官拉里·佩奇九年前创立 Alphabet(谷歌和其他子公司的控股公司)时所考虑的。他希望开发“登月计划”——可能会改变世界的新业务,这些业务可能需要数年时间才能孵化,并且不一定与谷歌现有的成功挂钩。
如今,其中一些项目已经失去了光彩。即使是其最著名和最有前途的项目,Waymo 的自动驾驶出租车(谷歌 DeepMind 帮助开发了其软件),也只在凤凰城、洛杉矶和旧金山实现了全面商业部署。但Isomorphic Labs无疑是一个Alphabet级别的项目。谷歌 DeepMind 希望找到更多这样的项目并使它们具有商业可行性:“我们现在有了一些蓝图,”默多克说。
在大型上市公司内部运营一个雄心勃勃的研究实验室的想法并不新鲜。哈萨比斯了解两个最著名的实验室:贝尔实验室和施乐帕洛阿尔托研究中心的历史。 “这就是我的全部灵感——他们的黄金时代、他们的鼎盛时期——这就是我在 DeepMind 试图创造的东西,”他说。
即使经过深思熟虑和谷歌规模的资源,也没有什么是万无一失的。技术分析师本尼迪克特·埃文斯 (Benedict Evans) 指出,尽管 AT&T 与贝尔实验室取得了成功——发明了激光器、晶体管和光伏电池等——“建立一个通用的创新实验室并推出产品一直很困难。”洛阿尔托研究中心是 20 世纪 70 年代现代计算许多元素的诞生地,但它之所以出名,部分原因是施乐未能充分利用这些元素。
尽管如此,Isomorphic Labs 已经过了概念验证阶段。今年 1 月,该公司宣布与制药巨头礼来公司和诺华公司建立战略合作伙伴关系,该公司表示,这可以带来近 30 亿美元的预付款,甚至可能为其参与开发的药物带来特许权使用费。收费之前也是如此。
对于Alphabet来说,30亿美元根本不算什么。该公司2023年的收入将为3070亿美元,主要来自广告。这笔资金无法满足该公司的近期需求:将突破性的人工智能功能注入其现有的、无处不在的软件产品中。然而,哈萨比斯的预测是乐观的。
“人工智能还有什么比治疗可怕的疾病更好的用途呢?”他问道。 “但我认为最终这对 Alphabet 来说也非常有价值。我认为这并不矛盾。”
一款为作家和研究人员提供的人工智能增强型笔记工具似乎最不可能在网上获得 15 分钟的名气。但在 9 月底,谷歌通过音频概述吸引了 TikTok、X 和 YouTube 上的用户,这是去年推出的免费 NotebookLM 网络应用程序的一项新功能。向其提供参考资料(例如 PDF 和网页),它会使用 Gemini 在两个合成主机之间就任何主题创建类似播客的对话。他们的对话听起来如此自然——充满了“嗯”、“啊”、笑话和离题——以至于毫无戒心的听众可能会误认为这是由真人主演的一些晦涩难懂的节目。
哈萨比斯似乎对这种病毒般的热爱感到有点兴奋(与谷歌早期人工智能的一些失误形成鲜明对比),他说他对这种反应感到高兴,有人称之为 Gemini 的 ChatGPT 时刻。 。 “在科学领域,你发表一篇论文,得到审稿人,然后你会看到引用,诸如此类的事情,”他说,这“在某些方面更直观,也非常令人兴奋。”
然而,并不是所有人都对科技行业急于开发日益强大的法学硕士、使基于法学硕士的产品广泛使用以及更接近通用人工智能感到兴奋。谷歌内部一直存在紧张关系。谷歌DeepMind成立后不久,被誉为“人工智能教父”、谷歌大脑领导者之一的杰弗里·辛顿(Geoffrey Hinton)的辞职就是一个很好的例子。辛顿表示,他离开是为了能够更自由地谈论未来的危险。
生命未来研究所执行董事安东尼·阿吉雷 (Anthony Aguirre) 表示,谷歌最近推出的 Gemini 功能表明“他们被迫与 LLM 竞争,因为一旦 OpenAI 打开大门,每个人都必须这样做。” 2023 年 3 月发布了一封呼吁暂停 LLM 开发六个月的公开信英语学习重要性,已有超过 33,000 人签署。 “我认为这有点不幸,因为我真的很喜欢设计人工智能来解决我们实际遇到的问题的目标。”
尽管谷歌和其他人工智能公司一样没有理会暂停研究的呼吁,但这封信确实引发了关于通用人工智能潜在存在风险的更坦率的讨论。今年 5 月,Hassabis、Legg、Hinton、OpenAI 首席执行官 Sam Altman、Anthropic 联合创始人 Dario Amodei 和 Daniela Amodei、微软首席技术官 Kevin Scott 等人签署了一封令人震惊的 23 字公开信:“缓解 AI 灭绝风险”与流行病和核战争等其他社会规模的风险一样,应该成为全球优先事项。
哈萨比斯强调,他并不认为可怕的情况是不可避免的;控制 AGI 可能比某些人担心的要简单。但他解释说,通过签署这封信,他打算发表一个声明。 “我想确保谈论这些事情的人受到另一群人的保护,他们说,‘这里没什么可看的,一切都会好起来的——这只是正常的技术,’”他说。
负责任地部署人工智能可能最近才成为头条新闻,但 DeepMind 从早期就明白了这一点:“当我采访 Legg 时,他谈到了代理和安全的重要性,”早期负责总监 King 的现任高级招聘人员说道。 2018 年,随着公司的重点从游戏 AI 转向具有更大潜在影响的工作(例如 AlphaFold),拥有一支专门从事这项工作的团队将至关重要。
易卜拉欣最近担任首席运营官,他在英特尔和 Coursera 等公司工作了多年,负责组建该委员会。起初,“我们实际上将其称为‘稍后命名的委员会’,因为我们不想暗示风险很高,”她回忆道。 “我们的目标是建立一种与 DeepMind 一致的文化,但可以指导和解决其中一些问题。”
随着时间的推移,CTBNL 的正式名称变成了“安全与责任委员会”。该委员会由来自公司各个部门的领导组成,为正在进行的项目提供反馈,重点是在潜在问题实际出现之前识别它们。 “早期参与是参与并真正帮助塑造和影响工作的最佳方式,”负责任发展总监 Dawn Bloxwich 说。
这种对人工智能安全的预期方法并没有阻止谷歌发布具有明显缺陷的功能从「天才少年」到被迫「追赶者」:诺奖得主、AlphaGo之父Demis Hassabis眼中的AI未来,例如那些搜索人工智能概述的功能,这些功能无法理解人类何时在开玩笑,而不是提供有用的建议。 King 表示:“通过我们所做的所有测试,我们永远不会覆盖世界上每个人可能尝试的所有内容,因为人类是有创造力的。”他指出,在某些情况下,问题可能更多地与特定于产品的实现有关。而不是 Google DeepMind 向其他 Google 团队提供的核心技术。 “每次我们看到安全问题时,它对我们都很有用,因为这样我们就可以推动模型开发的变化。”
谷歌不得不为用户发现的故障道歉,强调其在后 ChatGPT 时代推出新功能的紧迫性。根据 The Information 的 Jon Victor 在 4 月份发表的一篇文章,哈萨比斯本人对日益强调将人工智能快速商业化以造福大众感到不安,这导致 DeepMind 和 Google Brain 合并成立了 Google DeepMind。
最初,“我有点担心会损害我们的研究路线图,”哈萨比斯向我承认。但随着时间的推移,他认为整合谷歌人工智能专业知识和技术堆栈的好处变得更加明显:“我们是一家以研究为主导的公司。我们仍然是一个以研究为主导的部门。这与我们对世界的影响完全互补”。 Astra项目就是一个例子,10月英语学习重要性,Google重组并让Hassabis负责Gemini应用程序,拉近了Gemini产品与其底层LLM之间的距离。
在伦敦总部,走廊墙壁上贴满了海报,纪念该公司研究人员在《科学》和《自然》等科学期刊上发表的每一篇论文。哈萨比斯似乎并没有屈服于短期竞争压力。 James Manyika 自 DeepMind 成立以来就认识 Hassabis,并于 2022 年加入 Google,他说:“他一直坚持的一件事,我完全同意他的观点,那就是我们应该使用科学方法来完成所有这些工作。”高级副总裁,专注于技术与社会的融合。 “我们应该做实验,我们应该严谨,我们应该发表论文。”
这是 Google DeepMind 的“DeepMind 部分”——关注它是保护它的第一步。
原文链接:
本文来自微信公众号“学术头条”,作者:Harry McCracken;编译:阮文云,36氪授权发布。
猜你喜欢
发表评论
评论列表