黄仁勋问答:为什么摩尔定律已死,但元宇宙仍会发生

黄仁勋问答:为什么摩尔定律已死,但元宇宙仍会发生

当被问及为什么英伟达最新的40系列显卡售价高达1,600美元时,英伟达首席执行官黄仁勋表示,摩尔定律已经死了。他解释说,随着制造业的技术进步放缓,大流行的短缺使事情进一步混乱,成本不断下降的日子已经结束。

但不要太担心。人工智能和游戏的进步将共同推动人类雄心勃勃的梦想,就像元宇宙一样。

Huang上周在Nvidia在线GTC22会议的新闻问答中发表了讲话。

英特尔名誉董事长戈登·摩尔(Gordon Moore)在1965年提出的摩尔定律指出,芯片上的组件数量每两年就会翻一番。这是一个节拍器,预示着每隔几年芯片性能要么翻一番,要么成本减半。

几十年来,它一直如此,主要基于制造业的进步。但随着物理定律在小型化方面达到极限,这些进步不再被认为是理所当然的。英特尔正在大力投资,以使法律得以维持。但黄说,智能芯片设计必须接管,这就是为什么该公司转向其最新一代图形芯片的新架构。40系列图形芯片的结果是PC游戏出现了一些出色的性能,就像我们进入全球经济衰退一样。

黄认为,保持性能和能效的进步比以往任何时候都更加重要,因为我们正处于构建元宇宙的风口浪尖,虚拟世界的 3D 宇宙都是相互关联的,就像在小说中一样雪崩和头号玩家。英伟达已经构建了 Omniverse 标准化开发和模拟工具套件,以实现元宇宙。

但它不会是一个真正的元宇宙,除非它是实时的,并且可以容纳比今天访问 3D 空间更多的人。英伟达计划使用Omniverse在一个名为Earth 2的超级计算模拟中创建地球的数字孪生,这样它就可以预测未来几十年的气候变化。

有了这个,我们应该免费获得元宇宙,我们需要所有可用的芯片处理能力。他指出,由游戏推动的图形芯片使人工智能成为可能,将使开发人员能够用有趣的 3D 内容自动填充他们的元宇宙世界。换句话说,游戏和人工智能将相互帮助,推动芯片和元宇宙向前发展。对我来说,这听起来像是正在制定一项新法律。

以下是新闻问答的编辑记录。我们已经转录了整个新闻问答,我和其他一些媒体成员都参加了会议。

问:SaaS 业务可以有多大?

黄:嗯,很难说。这才是真正的答案。这取决于我们提供的服务软件。也许另一种方式是一次只吃一对。在这个GTC,我们宣布了新的芯片,新的SDK和新的云服务。我强调了其中两个。其中之一是大型语言模型。如果您还没有机会研究大型语言模型的有效性及其对AI的影响,请这样做。这是重要的东西。

大型语言模型很难训练。应用程序非常多样化。它经过了大量的人类知识训练,因此它具有识别模式的能力,但它也包含大量编码的人类知识。它有人类的记忆,如果你愿意的话。在某种程度上,它编码了我们的许多知识和技能。如果你想让它适应它从未被训练过做的事情——例如,它从来没有被训练去回答问题、总结一个故事或发布一个突发新闻的释义。它从未接受过做这些事情的训练。通过一些额外的学习镜头,它可以学习这些技能。

这种微调、适应新技能或所谓的零镜头或少镜头学习的基本思想,在很多领域都有很大的影响。这就是为什么你在数字生物学中看到如此大量的资金。大型语言模型已经学会了蛋白质结构的语言,化学的语言。所以我们把这个模型放了上去。这个机会能有多大?我的感觉是,每个国家/地区的每家公司都说每一种语言,他们的公司可能都有数十种不同的技能,他们的公司可以适应这些技能,我们的大语言模型可以执行。我不确定这个机会有多大,但它可能是有史以来最大的软件机会之一。这是因为智能自动化是有史以来最大的机会之一。

我们谈到的另一个机会是OmniVerse云。记住OmniVerse是什么。OmniVerse有几个特点。第一个特征是它摄取。它可以存储。它可以跨多个层或所谓的模式合成物理信息、3D 信息。它可以描述几何形状、纹理和材料。质量和重量等属性。连接。谁是供应商?费用是多少?它与什么有关?什么是供应链?如果行为,运动学行为——可能是人工智能行为,我会感到惊讶。

OmniVerse做的第一件事就是存储数据。它做的第二件事是连接多个代理。代理可以是人。他们可以是机器人。它们可以是自治系统。它做的第三件事是它给你一个进入另一个世界的视口,另一种说法是模拟引擎。OmniVerse基本上是三件事。它是一种新型的存储平台。这是一种新型的连接平台。它是一种新型的计算平台。您可以在 OmniVerse 之上编写应用程序。您可以通过 OmniVerse 连接其他应用程序。例如,我们展示了许多示例,其中Adobe连接到AutoDesk应用程序,并连接到各种其他应用程序。我们正在连接事物。你可以连接人们。你可以连接世界。你可以连接机器人。您可能正在连接代理。

思考我们对OmniVerse所做的事情的最好方法 - 几乎可以想象它 - 最简单的货币化方法可能就像数据库一样。它是云中的现代数据库。除了这个数据库是3D的。该数据库连接多个人。这是我们提出的两个SaaS应用程序。一个是大型语言模型,另一个是OmniVerse,基本上是一个将在云中的数据库引擎。我认为这两个公告 - 我很高兴你问。我会有很多机会一遍又一遍地谈论它。但是这两个SaaS平台将成为我们公司非常长期的平台。我们将使它们在多个云中运行,依此类推。

问:英伟达曾表示,它将在第四季度减少GPU的销售。您是指第四财季还是日历第四财年?您能否确认减少的销售将持续几个季度?

黄: 实际上,这取决于我们的第四财季在一月份结束。它关闭了一个月。我可以告诉你——因为我们一次只指导一个季度,所以我们非常具体地向市场销售,比从市场销售的价格低得多。比市场上销售的金额低得多。我希望到第四季度的时间框架,即第四季度的某个时候,该频道将正常化,并为 Ada 的出色发布腾出空间。我们将从本季度开始以一定数量的价格发货Ada,但绝大多数Ada将在下个季度推出。这些天我无法预测未来,但我们的期望和我们目前的想法是,我们在市场上看到的,我们知道的渠道和我们采取的营销行动,我们应该有一个非常棒的第四季度Ada。

问:您如何看待元宇宙的进展,尤其是比我们现在拥有的互联网更具响应性的实时元宇宙?如果它的发展速度可能比一些人想要的要慢,那么有哪些事情可以让它发生得更快,英伟达自己会考虑投资让它来得更快吗?

黄: 我们必须做几件事才能实现元宇宙,即实时元宇宙。首先,如您所知,元宇宙是由用户创建的。它要么是我们手工创建的,要么是我们在人工智能的帮助下创建的。在未来,我们很可能会描述房子或城市或类似的东西的一些特征 - 就像这个城市,像多伦多或纽约市,它为我们创造了一个新的城市。如果我们不喜欢它,我们可以给它额外的提示,或者我们可以继续按回车键,直到它自动生成一个我们想要开始的提示。然后从那个世界开始,我们将修改它。

在我们说话的时候,用于创建虚拟世界的人工智能正在实现。你知道,其核心正是我刚才谈到的称为大型语言模型的技术。能够从人类的所有创造中学习,并能够想象一个3D世界。因此,从文字到大型语言模型,总有一天会出现三角形、几何形状、纹理和材料。由此我们将对其进行修改。因为所有这些都不是预先烘焙或预渲染的——所有这些物理模拟和光模拟都必须实时完成。这就是为什么我们正在创建的有关RTX窄渲染的最新技术如此重要的原因。我们不能通过蛮力做到这一点。我们需要人工智能的帮助来做到这一点。我们刚刚用DLSS3演示了Ada,结果非常惊人。

第一部分是生成世界。二是模拟世界。然后第三部分是能够说,你之前提到的关于交互性的事情 - 我们必须处理光速。我们必须在世界各地建立一个新型的数据中心。我在GTC上谈到了它,并称它为GDN。虽然 Akamai 提出了 CDN,但我认为这个叫做 GDN 的新世界是一个图形分发网络。我們透過擴大 GeForce Now 網路來證明其有效性。我们在全球100个地区都有。通过这样做,我们可以拥有计算机图形学,这种交互性本质上是即时的。我们已经证明,在行星尺度上,我们可以拥有低至几十毫秒的交互式图形,这基本上是交互式的。

然后最后一部分是如何以增强的方式进行光线追踪,AR或VR方式。最近我们也证明了这一点。这些碎片正在融合在一起。引擎本身,称为OmniVerse Nucleus的数据库引擎,由人类构建或由AI增强的世界,一直到使用AI的模拟和渲染,然后是图形,世界各地的GDN,我们组合在一起的所有部分都汇集在一起。这次在GTC你看到了我们——我们与一家名为ReMap的非常酷的公司合作。他们的首席执行官与我们一起,从他们的设计工作室开始,通过按下按钮,将自动配置器一直发布到世界各地。我们立即发布了世界每个角落的汽车的交互式光线追踪模拟。我认为这些碎片正在融合在一起。现在 Ada 投入生产,我们只需要让 Ada 在世界的公共云中站起来,在世界各地的公司中站起来,并继续构建我们的分布式 GDN。该软件将在那里。计算基础设施将在那里。我们非常接近。

问:鉴于库存问题和物理供应链问题,我们已经看到,有了 OmniVerse 云,您正在进入 SaaS。您已經擁有 GeForce Now。您是否预见到将卡作为服务提供,而不是再分发实体卡的点?

黄: 我不这么认为。有些客户喜欢拥有。有些客户喜欢租房。有些东西是我租的或订阅的,有些东西是我更喜欢拥有的。企业就是这样。这取决于您喜欢资本支出还是运营支出。初创公司宁愿在运营支出中拥有东西。大型老牌公司宁愿有资本支出。这只取决于 - 如果你偶尔使用东西,你宁愿租房。如果您已满载并一直使用它,您宁愿拥有它并操作它。有些人宁愿把工厂外包。

请记住,人工智能将成为一个工厂。它将成为未来最重要的工厂。你知道,因为工厂有原材料进来,有东西出来。未来工厂会有数据进来,出来的是智能、模型。它的转变将是能量。就像今天的工厂一样,有些人宁愿将工厂外包,有些人宁愿拥有工厂。这取决于您所处的商业模式。

我们很可能会继续与惠普和戴尔以及世界各地的OEM一起制造计算机。我们将继续通过CSP提供云基础设施。但请记住,英伟达是一家全栈加速计算公司。另一种说法是,我把同样的事情说了两次,但加速计算公司需要全栈。原因是因为您没有将神奇的东西放入计算机中,并且它是什么应用程序并不重要,它的运行速度只是快 100 倍。加速计算是关于理解应用程序、应用程序的域,并重构整个堆栈,使其运行得更快。

因此,在过去的25年里,加速计算——我们从计算机图形学开始,进入科学计算和人工智能,然后进入数据分析。最近,您在图形分析中看到了我们。多年来,我们已经将其应用于许多领域,以至于Nvidia架构似乎加速了一切,但事实并非如此。我们加速。我们只是碰巧加速了3件事。这 000,3 件事都在一个架构下加速,所以看起来,如果你把 Nvidia 芯片放进你的系统,事情会变得更快。但这是因为我们一次做一个,一次一个领域。我们花了000年的时间。

我们有纪律坚持使用一种架构,以便随着时间的推移,我们加速的整个软件堆栈都会被我们构建的新芯片(例如 Hopper)加速。如果您在我们的架构之上开发新软件,它可以在我们 300 亿、400 亿个芯片的整个安装基础上运行。正是由于这门持续了几十年多的学科,它看起来就是这个加速计算的神奇芯片。我们将继续做的是将这个平台以各种可能的方式推向世界,以便人们可以为它开发应用程序。也许我们可以为它开发一些新的量子算法,这样它就可以在10年或20年内为密码学做好准备。发现搜索的新优化。新的网络安全,数字指纹算法。我们希望这个平台在那里,以便人们可以使用它。

但是,在三个不同的域中,您会看到我们做得更多。我们之所以会做更多,是因为如果我自己做过一次,我不仅会知道如何做,而且我们可以打开碎片,让其他人理解如何做。我举个例子。显然,你已经看到我们现在把计算机图形学一直带到了OmniVerse。我们已经建立了自己的引擎,自己的系统。我们一直走到了最后。这样做的原因是,我们想发现如何最好地在非常大的数据规模上进行实时光线追踪,融合人工智能和暴力路径追踪。如果没有OmniVerse,我们永远不会发展出这种技能。没有游戏开发人员愿意这样做。出于这个原因,我们推动了这一前沿,现在我们可以开放RTX,RTX DI,RTX GI和DLSS,我们可以将其放入其他人的应用程序中。

您看到我们这样做的第二个区域是驱动器。我们构建了一个端到端的自动驾驶汽车系统,这样我就可以了解如何从头到尾构建机器人技术,以及作为一家数据驱动型公司,一家机器学习运营公司,在如何构建机器人系统方面,这对我们意味着什么。现在,我们已经构建了云端硬盘。我们已经打开了所有部分。人们可以使用我们的合成数据生成。他们可以使用我们的模拟器等。他们可以使用我们的计算堆栈。

第三个领域是大型语言模型。我们制造了世界上最大的模型之一,最早的,几乎比其他任何人都早。它被称为威震天530B。它仍然是世界上最复杂的语言模型之一,我们将把它作为一种服务,这样我们就可以理解它的含义。

当然,为了真正了解如何为元宇宙应用程序构建行星规模的平台——特别是我们将专注于工业元宇宙应用程序。您必须构建数据库引擎。我们构建了OmniVerse Nucleus,并将其放在云中。在一些应用程序中,我们认为我们可以做出独特的贡献,但实际上很难。你必须在数据中心规模、全栈规模上思考全球。但除此之外,我们将保持平台完全开放。

问:我想再问你一点关于中国出口管制限制的问题。根据您目前对许可证标准的了解,您是否预计 Hopper 以外的所有未来产品都会受到这些标准的影响,基于性能和互连标准?如果是这样,您是否有针对中国市场特定产品的计划,这些产品仍将遵守规则,但在开发时会包含新功能?

黄:首先,霍珀不是一个产品。霍珀是一种架构。安培不是产品。安培是一种架构。请注意,安培有 A10、A10G、A100、A40、A30 等。在安培内部,天哪,有多少个版本的产品?大概是 15 或 20 个。漏斗也是一样。将有许多版本的Hopper产品。这些限制指定了计算能力和芯片到芯片互连的特定组合。它非常清楚地说明了这一点。在该规范中,在该规范的信封下,对于我们和客户来说都是一个巨大的空间。事实上,我们的绝大多数客户都不受该规范的影响。

我们的期望是,对于美国和中国,我们将拥有大量架构兼容的产品,这些产品在限制范围内,根本不需要许可。但是,如果客户特别希望拥有限制或超出限制规定的限制,我们必须为此获得许可证。您可以推测,目标不是减少或阻碍我们的业务。目标是知道谁需要这个极限的能力,并让美国有机会决定是否应该向其他国家提供这种技术水平。

问:我最近与一家英国大型软件开发商的人士进行了交谈,他们深入研究了人工智能和元宇宙。我们讨论了人工智能如何帮助开发游戏和虚拟世界。显然,这里有资产创造,还有NPC的寻路和类似的东西。关于汽车,这些技术可能在某种程度上相互关联。你有态势感知,类似的东西。您能告诉我们您认为未来会如何发展吗?

黄:当您看到主题演讲时,您会注意到我们在几个不同的领域非常具体地演示了寻路。当你看到我们的自动驾驶汽车时,基本上发生了三件事。有传感器,传感器进入计算机。使用深度学习,我们可以感知环境。我们可以感知然后重建环境。重建不必完全符合我们看到的保真度,但它必须知道周围的环境,重要特征,障碍物在哪里,以及这些障碍在不久的将来可能在哪里。这是感知部分,然后是第二部分,即世界模型创建。在世界模型创建过程中,你必须知道周围的其他一切在哪里,地图告诉你什么,你在世界上的位置,并重建相对于地图和相对于其他人的位置。有些人称之为机器人的本地化和映射。

第三部分是路径规划、规划和控制。规划和控制有路线规划,它有一些人工智能,然后是路径规划,这是关于寻路的。寻路与你想去的地方、你周围的障碍物在哪里以及你想如何绕过它有关。你在演示中看到了一个叫做PathNet的东西。你看到一大堆线条从车前出来。这些线路本质上是我们正在分级的选项,以查看其中哪一条路径是最佳路径,最安全,然后最舒适,将您带到最终目的地。你一直在做寻路。但其次是机器人的ISAAC。如果你愿意的话,那里的寻路系统还有一点,从某种意义上说,你没有车道可循。工厂是非结构化的。到处都是很多人。事物通常没有标记。你只需要从一个航点到另一个航点。在航点之间,同样,你必须避开障碍物,找到最有效的路径,而不是把自己挡在里面。你可以把自己引向死胡同,你不希望这样。那里有各种不同的算法来进行路径规划。

ISAAC路径规划系统,你可以在游戏中看到这一点。在那里你可以说,士兵,从A点到B点,这些点相距很远。在A点和B点之间,角色必须穿过岩石,巨石和灌木丛,绕过河流,诸如此类。因此,我们会以一种非常人性化的方式表达出来。你看到ISAAC做到了这一点,你可能在演示中看到过另一种人工智能技术,称为ASE。基本上是对抗性技能嵌入。这是一个人工智能,通过观察一大群人,学会了如何从单词的提示中以人类的方式表达。你可以说,走到那块石头上,或者走到路点B.爬上树。挥剑。踢球。从短语中,您可以描述人类动画。我刚刚给了你一些人工智能模型,这些模型允许我们进行多人游戏,并拥有非常逼真且易于控制的人工智能角色。因此,未来的元宇宙将有一些真实的人,一些是人工智能代理的人,还有一些是你使用 VR 或其他方法进入的化身。这些技术已经存在。

问:既然您已经推出了用于自动驾驶汽车的新芯片,您如何看待自动驾驶业务的未来?您认为这种业务仍处于早期阶段,还是看到某种浪潮即将席卷整个行业?您能告诉我们您在这一领域的战略思维吗?

黄: 首先,自动驾驶汽车有两台计算机。数据中心里有一台计算机,用于开发在汽车中捕获的数据处理,将数据转换为经过训练的模型,开发应用程序,模拟应用程序,回归或重播所有历史记录,构建地图,生成地图,重建地图(如果你愿意的话),然后做CIC,然后做OTM。第一台计算机本质上是一辆自动驾驶汽车,只不过它在数据中心。它做自动驾驶汽车所做的一切,除了它非常大,因为它从整个车队收集数据。该数据中心是自动驾驶汽车系统的第一部分。它具有数据处理,AI学习,AI训练,模拟和映射。

然后第二部分是你把整个东西放进车里,一个小版本。这个小版本就是我们公司所说的——Orin是芯片的名称。下一个版本称为雷神。该芯片必须进行数据处理,这称为感知或推理。它必须建立一个世界模型。它必须与映射有关。它必须进行路径规划和控制。

这两个系统都在连续运行,两台计算机。英伟达的业务是双方的。事实上,你可能会说,我们自动驾驶的数据中心业务甚至更大,绝对更大,坦率地说,从长远来看,是两部分中较大的。这是因为自动驾驶汽车的软件开发,无论有多少,都永远不会完成。每家公司都将运行自己的堆栈。这部分业务非常重要。

我们创建了OmniVerse——OmniVerse的第一个客户是DRIVE Sim,它是车队的数字孪生。DRIVE Sim将成为我们自动驾驶业务中非常重要的一部分。我们在内部使用它。我们将提供它供其他人使用。然后在车里,有几件哲学上我们相信的事情。如果你看看过去人们构建ADAS系统的方式,看看Nvidia构建它的方式,我们发明了一种叫做Xavier的芯片,它确实是世界上第一个软件可编程机器人芯片。它是为高速传感器设计的。它有很多深度学习处理器。它有Cuda,用于本地化映射和路径规划和控制。当我第一次介绍Xavier时,很多人都说为什么有人需要这么大的SOC?事实证明,泽维尔还不够。我们需要更多。

奥林是一个本垒打。如果你看看我们现在的机器人业务,包括自动驾驶汽车、班车、卡车和各种自主系统,我们的整个机器人业务每年的运行额已经超过1亿美元。Orin正在路上 - 管道现在有11亿美元。我的感觉是,我们的机器人业务正在一年内翻一番,它将成为我们业务的重要组成部分。我们的理念与过去这个领域的人非常不同,有几种不同的技术结合在一起,使机器人成为可能。当然,其中之一就是深度学习。我们是第一个将深度学习引入自动驾驶的公司。在我们之前,它实际上是基于激光雷达的。它基于工程师开发的手动调整的计算机视觉算法。我们使用深度学习,因为我们认为这是最具可扩展性的方式。

其次,我们所做的一切都是软件定义的。您可以非常轻松地更新软件,因为有两台计算机。数据中心的计算机开发软件,然后将软件部署到汽车中。如果你想在庞大的车队上做到这一点,并在软件工程的基础上快速移动和改进软件,那么你需要一个真正可编程的芯片。我们关于使用深度学习和完全软件定义平台的理念确实是一个不错的决定。花了更长的时间,因为它的成本更高。人们必须学习如何为它开发软件。但我认为在这一点上,每个人都会使用这种方法已成定局。这是前进的正确方向。我们的机器人业务有望成为一项非常大的业务。它已经是一个非常大的业务,而且会更大。

问:关于你提到的 Ada 的 AI 一代,它不仅仅是生成新的像素,而是现在全新的帧,随着我们对 AI 生成的图像的不同来源,我们看到 DALL-E 和所有这些不同的算法在互联网上爆炸。对于视频游戏来说,这可能不是最好的用例。但是,创作的另一面怎么可能——你有广播等技术和专注于创作者的东西。除了游戏开发人员之外,其他用户如何利用该AI技术来生成新图像,导出新帧,以新的帧速率流式传输?您是否一直在研究这种方法以更多地利用人工智能技术?

黄: 首先,使用路径追踪(不是离线照明,不是预烘焙照明,而是实时合成的所有内容)以非常高的帧速率合成计算机图形的能力非常重要。原因是它支持用户生成的内容。请记住,我在主题演讲中提到,当今世界排名前 10 的视频游戏中有 <> 款曾经是模组。这是因为有人把原来的游戏改成了一个更有趣的游戏,变成了一个MOBA,变成了一个五对五的游戏,变成了一个绝地求生。这需要粉丝和爱好者修改特定的游戏。这需要付出很多努力。

我认为在未来,我们将拥有更多的用户生成内容。当你有用户生成的内容时,他们根本没有大量的艺术家来建造另一堵墙或拆除另一堵墙或修改城堡或修改森林或做任何他们想做的事情。每當你修改這些東西,這些結構,世界,那麼照明系統就不再準確了。使用 Nvidia 的路径追踪系统并实时执行所有操作,我们使每个照明环境都可能正确,因为我们在模拟光线。无需预烘烤。这是一件大事。事实上,如果你将RTX和DLSS 3与OmniVerse结合起来,我们已经为mods制作了一个名为RTX Remix的OmniVerse版本。如果你把这些想法结合起来,我相信用户生成的内容将会蓬勃发展。

当你说用户生成的世界时,那是什么?人们会说这就是元宇宙,确实如此。元宇宙是关于用户生成的、用户创建的世界。所以我认为每个人都会成为创造者。你将采用OmniVerse和RTX以及这种神经渲染技术,并生成新的世界。一旦你能做到这一点,一旦你可以模拟现实世界,问题是,你能用自己的双手创造整个世界吗?答案是否定的。原因是因为我们在大自然母亲的世界里有好处来帮助我们。在虚拟世界中,我们没有这个。但我们有人工智能。我们只会说,给我一个海洋。给我一条河。给我一个池塘。给我一片森林。给我一片棕榈树林。你描述任何你想描述的东西,人工智能就会在你面前合成3D世界。然后您可以修改。

我所描述的这个世界需要一种新的计算机图形学方法。我们称之为神经渲染。它背后的计算平台我们称之为RTX。这真的是关于,第一,制作视频游戏,今天的视频游戏,要好得多。提高帧率。今天的许多游戏,因为世界太大,它们已经变得CPU受限。在 DLSS 3 中使用帧生成,我们仍然可以提高帧率,这非常惊人。另一方面,用户生成内容的整个世界是第二个。第三个是我们今天所处的环境。

我们今天参加的这个视频会议相当过时。在 1960 年代,视频会议真正被创造出来。将来,视频会议将不会进行编码和解码。在未来,它将是感知和生成。感知和生成。你的相机会在你这边感知你,然后在我这边生成。您可以控制该生成的工作方式。因此,每个人的帧率都会更好。每个人的视觉质量都会更好。使用的带宽量很小,只有一点点带宽,可能以千比特每秒为单位,而不是兆比特。我们使用神经渲染进行视频会议的能力将是一个非常令人兴奋的未来。这是远程呈现的另一种说法。它有很多不同的应用程序。

问:我在演示文稿中注意到卡上没有 NVlink 连接器。艾达完全消失了吗?

黄:Ada上没有NVlink。我们之所以把它拿出来,是因为我们需要 I/O 来做其他事情。我们使用 I/O 和该区域来尽可能多地塞入 AI 处理。而且,由于 Ada 基于 PCIe Gen 5,我们现在有能力在第 5 代之间进行点对点,速度足够快,这是一个更好的权衡。这就是原因。

问:回到贸易问题,你对贸易限制及其破坏创新的潜力是否有大局观?

黄: 嗯,首先,需要公平贸易。这是值得怀疑的。需要有国家安全。这始终是一个问题。有很多事情也许有人知道,而我们不知道。然而,没有什么是绝对的。只需要有学位。你不能有公开的、完全公开的不公平交易。如果不考虑国家安全,就不可能完全不受限制地获取技术。但你不能没有交易。而且你不能没有生意。这只是程度的问题。我们受到的限制和许可限制为我们提供了足够的空间继续与我们的合作伙伴在中国开展业务。它为我们提供了充足的创新空间,并继续为那里的客户服务。如果需要最极端的例子和使用我们的技术,我们可以去寻求许可证。

从我的角度来看,这一限制与出口管制的任何其他技术限制没有什么不同。CPU 上还存在许多其他技术限制。CPU长期以来一直受到限制,但CPU在世界各地广泛使用,在世界各地自由使用。我们之所以不得不披露这一点,是因为它出现在季度中期,而且来得很突然。因为我们处于本季度中期,我们认为这对投资者来说很重要。这是我们业务的重要组成部分。对于其他受影响的人来说,这并不是他们业务的重要组成部分,因为加速计算在Nvidia之外仍然相当小。但对我们来说,这是我们业务中非常重要的一部分,因此我们必须披露。但是,在基于安培和料斗架构为客户提供服务方面,我们有一个非常大的信封来创新和服务我们的客户。从这个角度来看,我一点也不担心。

问:4000终于来了,对你来说,我相信这感觉就像是一个巨大的发布。我看到的普遍反应是,哦,天哪,这要花这么多钱。关于新一代零件的定价,您有什么想对社区说的吗?他们能期望在某个时候看到更好的定价吗?基本上,你能解决我到处看到的大声尖叫吗?

黄:首先,今天的12英寸晶圆比昨天贵得多。它并没有贵一点点。它贵了一吨。摩尔定律已经死了。摩尔定律以相同的成本提供两倍的性能,或者在每年半的成本中以一半的成本提供相同的性能,它已经结束了。一切都完全结束了。不幸的是,芯片将随着时间的推移而降低成本的想法已成为过去。未来是关于加速全栈的。你必须提出新的架构,想出尽可能好的芯片设计,然后计算当然不是芯片问题。计算是一个软件和芯片问题。我们称之为全栈挑战。我们在整个堆栈中进行创新。

对于我们所有的游戏玩家,我希望你记住并希望注意到这一点。在相同的价位上,基于我刚才所说的,尽管我们的成本,我们的材料成本比以前更高,但一年前,两年前,英伟达的899美元GPU或1599美元的GPU的性能 - 我们与Ada Lovelace的表现要好得多。图表更好。这确实是看待它的基础。当然,编号系统只是一个编号系统。如果你回过头来,3080 与 1080 相比 980 与 680 相比 280,一直回到 280——显然,280 在过去要低得多。

随着时间的推移,我们必须创造,一方面追求计算机图形学的进步,另一方面以相同的价格提供更多价值,通过越来越低的价格解决方案深入市场——如果你看看我们的业绩记录,我们一直在做这三点。我们正在将计算机图形学的新领域进一步推向新的应用。看看由于GeForce的进步而发生的所有伟大的事情。但在相同的价格点上,我们世代交付的价值超出了图表,这次仍然不在图表上。如果他们能记住价格点,将价格点与价格点进行比较,他们会发现他们会喜欢Ada。

问:你谈到了你正在计划的一切,你对机器人业务的巨大期望。在业务方面,是否有任何事情可以让您夜不能寐,这可能会危及您的业务以及目前的情况?您认为哪些事情是必须应对的挑战?

黄:今年,我想说的是,世界工业面临的外部环境挑战数量非同寻常。它始于新冠疫情。然后是供应链挑战。然后是中国的整个供应链关闭。整个城市每周都被封锁。更多的供应链挑战。突然之间,欧洲发生了一场战争。能源成本上升。通货膨胀率居高不下。我不知道。还有什么可能出错的吗?然而,这些事情并不能让我夜不能寐,因为它们超出了我们的控制范围。我们尽量保持敏捷,做出正确的决策。

三四个月前,我们做出了一些非常好的决定,因为我们看到PC市场整体开始放缓。当我们看到由于通货膨胀而开始导致消费市场放缓的抛售时,我们意识到我们将有太多的库存来到我们身边。我们的库存和供应链始于去年下半年。那些晶圆和那些产品正在向我们走来。当我意识到销售将受到限制时,我们没有继续发货,而是关闭了自己。我们吃了四分之二的硬药。我们向客户、向世界销售,比渠道外的销售要低得多。该频道,只是桌面游戏频道,称其为每季度 2 亿美元。我们的销量远低于第二季度和第三季度。我们为自己做好了准备,为我们的频道做好了准备,我们的合作伙伴也为Ada的发布做好了准备。

我想说的是,我们可以做的事情,我们努力做出正确的决定。其余的都在继续创新。在这不可思议的时期,我们建造了Hopper。我们发明了 DLSS 3。我们发明了神经渲染。我们建立了OmniVerse。恩典正在建立中。奥林正在被斜坡。在这一切中,我们正在努力帮助世界各地的公司通过加速计算成本来降低计算成本。如果可以加速 Hopper,对于大型语言模型,Hopper 可以将计算速度提高五倍。即使您必须将 Hopper 添加到系统中,TCO 仍然提高了三倍。如何在摩尔定律结束时将 TCO 提高三倍?这是非常惊人,令人难以置信的结果,帮助客户节省资金,同时我们为客户发明新的想法和新的机会来重塑自己。我们专注于正确的事情。我确信所有这些挑战,环境挑战,都会过去,然后我们会回到做惊人的事情。这些都不能让我夜不能寐。

问:您已经开始运送H100。这对你来说是个好消息。来自春天的大坡道。但是现在Lovelace出来了,我很好奇。我们会看到 L100 吗?您能否就这次如何划分这两种架构提供任何指导?

黄: 如果你看看我们的图形业务,让我们一直回到图灵。在图灵时代——这只是两代人之前,或者大约四五年前——我们的核心图形业务基本上是两个部分。其中之一是台式电脑、桌面游戏,另一个是工作站。这真的是两个人。台式机工作站和桌面游戏系统。安培一代,由于其令人难以置信的能源效率,开辟了一大堆笔记本业务。轻薄游戏系统、轻薄工作站成为真正的主要驱动力。事实上,我们的笔记本业务相当大,几乎成比例地与我们的台式机业务非常相似,或者接近它。在安培一代,我们也非常成功地将其带入云,进入数据中心。它用于数据中心,因为它是推理的理想选择。安培一代在推理 GPU 方面取得了巨大成功。

这一代人,你会看到几件事。有一些新的动态正在发生,长期趋势非常明显。其中之一与云图形有关。当然,云游戏现在在世界各地都是一件非常真实的事情。在中国,云游戏将非常庞大。有十亿部手机,游戏开发人员不再知道如何服务。他们建立了非常好的连接,但图形太差了,以至于他们不知道如何将为现代iPhone 14构建的游戏放在五年前的手机上,因为技术发展如此之快。仅在中国就安装了十亿部手机。在世界其他地方,我认为有类似数量的手机。游戏开发人员不再知道如何用现代游戏来服务这些游戏。解决这个问题的最佳方法是云游戏。您可以访问集成显卡。您可以访问移动设备等。

如果您可以为云游戏执行此操作,那么显然可以为图形密集型的流媒体应用程序执行此操作。例如,过去是在PC上运行的工作站应用程序,将来它们将只是从云流式传输的SaaS。GPU将是其中之一 - 目前它是A4s,A40s,A10s。这些Ampere GPU将是流式处理图形密集型应用程序。然后是一个新的非常重要的,那就是增强现实流式传输到你的手机。短视频,视频的图像增强,也许重新摆姿势,让你的眼睛与每个人进行眼神交流。也许这只是一张非常漂亮的照片,你正在为脸部制作动画。这些类型的增强现实应用程序将在云中使用GPU。在 Ada 一代中,我们将看到可能是在云中使用图形密集型 GPU 进行 AI、图形、计算机视觉、流媒体的最大安装。它将成为通用加速器。那肯定会到来的。事实上,我没有叫它L100,我叫它L40。L40将成为我们的高端Ada GPU。它将用于OmniVerse,增强现实,云图形,推理,训练,所有这些。L40将是一款非凡的云图形GPU。

问:这似乎是你发布的东西的很大一部分,汽车方面,医疗方面——感觉很少有人在人工智能安全方面。似乎更多的硬件加速。您能谈谈AI安全的重要性吗?

黄:这是一个很大的问题。让我把它分成几个部分,作为一个起点。一般来说,都有值得信赖的人工智能问题。但是,即使你开发了一个你相信你信任的人工智能模型,你用适当策划的数据训练,你不相信它有过度偏见或不必要的偏见或不受欢迎的偏见——即使你想出了这个模型,在安全的背景下,你也希望有几件事。第一件事是你想要多样性和冗余。一个例子是在自动驾驶汽车的背景下。你想观察哪里有障碍物,但你也想观察哪里没有障碍物,我们称之为自由空间。要避开的障碍物,您可以开车通过的自由空间。这两个模型如果相互叠加,将为您提供多样性和冗余。

我们在公司中这样做。我们在医疗领域这样做。它被称为多模态等等。我们有算法的多样性。我们在计算方面具有多样性,因此我们以两种不同的方式进行处理。我们使用传感器进行多样性。其中一些来自相机。其中一些来自雷达。其中一些来自运动结构。其中一些来自激光雷达。您有不同的传感器和不同的算法,然后是不同的计算。这些是安全层。

然后下一部分是,假设你设计了一个你知道具有主动安全能力的系统。你相信它以这种方式具有弹性。你怎么知道它没有被篡改?你设计得当,但有人进来篡改了它,导致它不安全。我们必须确保我们拥有一种称为机密计算的技术。从启动系统,以便在启动时测量没有人篡改,到加密模型并确保它没有被篡改,再到以您无法探测和更改它的方式处理软件。即使这样也会受到影响。然后一直回到开发软件的方法论。

一旦你认证和验证一个完整的堆栈是安全的,你希望确保公司中的所有工程师和为它做出贡献的每个人都在为软件做出贡献,并以一种保持其保持认证和保持安全的能力的方式改进软件。有文化。有使用的工具。有方法论。有文档和编码的标准。一切从 - 我刚刚提到车内的防篡改。数据中心是防篡改的。否则,在我们OTA将模型OTA到汽车之前,有人可能会篡改数据中心的模型。无论如何,主动安全,安全设计进入软件,安全设计进入人工智能是一个非常大的话题。我们致力于做正确的事情。

问:由于我们遇到的短缺,英伟达比平时提前从台积电预订了生产能力。AIB 是否也必须提前很久预订 GPU 供应?随着价格的降低,比如3080ti、3090ti,AIB可以利用的价格是否有回扣和激励措施?

黄: 去年,供应链受到了如此大的挑战。发生了两件事。一件事是交货时间延长。过去,从将PO放在晶圆上开始到您运送产品的时间大约需要四个月。也许稍长一些。十六周?它一直延长到一年半。这不仅仅是晶圆开始。您需要处理基板,电压调节器,各种东西,以便我们运送产品。它包括一大堆系统组件。我们的周期时间大大延长,第一。第二,因为一切都太稀缺了,你必须提前确保你的分配,然后导致你进一步确保分配大约一年。在四个月到突然之间,大约两年左右的正常运行条件不得不安排。而且我们成长得如此之快。我们的数据中心业务每年增长近 100%。这是一项价值数十亿美元的业务。你可以想象,在我们的增长率和额外的周期时间之间,我们必须做出多少承诺。这就是为什么我们不得不做出艰难的决定,因为需求放缓,尤其是消费者的需求放缓,真正大幅减慢出货量,让渠道库存自行处理。

对于AIB,AIB不必下交货时间订单。无论如何,我们订购了组件。我们的AIB是敏捷的。我们承担了绝大多数库存。当市场真的很火的时候,渠道,我们的售价都一模一样。它从未动过一美元。正如人们去年所知道的那样,我们的组件成本不断上升,但我们吸收了所有成本的增加。我们把零美元转给市场。我们将所有产品价格完全保持在我们推出的建议零售价。我们的 AIB 具有创建不同 SKU 的优势,使他们能够获得更多价值。当然,渠道,分销商和零售商,在产品火热的时候受益。

当需求放缓时,我们采取行动创建营销,我们称之为营销计划。但基本上是折扣计划,回扣计划,允许市场上的定价回到我们认为或市场认为最终会卖出的价格点。我们做出的承诺的结合,导致了你们 - 你们看到我们减记了价值约4亿美元的库存。其次,我们在营销计划中投入了几亿美元,以帮助渠道重置价格。在我们几个月前采取的这两项行动之间,随着Ada的艰难增长,我们应该在第四季度处于有利地位。我很期待。这些决定是痛苦的,但它们是必要的。这是六个月的艰辛,希望在那之后我们可以继续前进。

问:我想知道你是否可以解决为什么没有RTX 4070,以及4070是否会到来。您是否告诉消费者购买 3000 系列卡?

黄:我们还没有准备好所有东西来一次推出所有内容。我们准备好的是 4090 和 4080。随着时间的推移,我们将把其他低端的产品推向市场。但这并不比我们通常从高端开始更复杂,因为这是发烧友想要首先刷新的地方。我们发现 4080 和 4090 是一个很好的起点。我们将尽快在堆栈中进一步向下移动。但这是一个很好的起点。

问:你对EVGA从RTX 40系列开始停止生产显卡有什么看法?英伟达在做出这一决定时是否与EVGA进行了密切讨论?

黄:安德鲁想结束这项业务。他想这样做已经有几年了。Andrew和EVGA是很好的合作伙伴,看到他们离开市场,我感到很难过。但他还有其他计划,他已经考虑了好几年了。我想就是这样。市场上有很多伟大的参与者。它将在EVGA之后很好地供应。但我永远会想念他们。它们是我们历史的重要组成部分。安德鲁是一个好朋友。只是他该去做别的事情了。

问:你会对 30 年前的 Jensen 说些什么?

黄:我想说的是追随你的梦想,你的愿景,你的心,就像我们一样。一开始非常可怕,因为您可能从我们的历史中知道,我们发明了GPU。在我们发明GPU的时候,还没有GPU的应用程序。没有人关心GPU。当我们来到这个世界为视频游戏建立一个平台时,视频游戏市场很小。它几乎不存在。我们完全用3D谈论视频游戏,甚至没有3D设计工具。您必须手动创建3D游戏。我们谈到了一种新的计算模型,加速计算,这是我们公司在 1993 年成立的基础。这种新的计算方法工作量太大,没有人相信它。当然,现在我别无选择,只能相信它。这是我们的公司,我们希望让它成功。我们全力以赴地追求它。

一路走来,缓慢但肯定地,一个接一个的客户,一个又一个的合作伙伴,一个又一个的开发人员,GPU成为一个非常重要的平台。英伟达发明了可编程着色,现在定义了现代计算机图形学。它促使我们发明了RTX,发明了Cuda,开发了现代加速计算。它把我们引向了人工智能。它把我们引向了我们今天谈论的所有事情。所有这一切,每一步,无一例外,没有人相信它。GPU,可编程着色,Cuda,甚至深度学习。当我把深度学习带到汽车行业时,每个人都认为这很愚蠢。事实上,其中一位首席执行官说:“你甚至无法发现一只德国狗。你怎么能发现行人?他们把我们注销了。当时的深度学习并不完美,但今天它当然达到了超人的能力。

我给年轻的詹森的建议是坚持下去。你在做正确的事。你必须追求你所相信的。一开始你会有很多人不相信它,但不是因为他们不相信你。只是因为有时很难相信。怎么会有人相信用于玩《雷神之锤》的处理器会是使计算机科学现代化并将人工智能带到世界的处理器?我们用于Portal的处理器与自动驾驶汽车的处理器相同。没有人会相信。首先,你必须相信它,然后你必须帮助其他人相信它。这可能是一个很长的旅程,但没关系。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/3537.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Bluesky 通过成本治理算法帮助优化云工作负载

下一篇

新的深度伪造威胁迫在眉睫

微信公众号

微信公众号