未经允许不得转载,务必保存原文出处链接和公众号按钮
文:Web3天空之城·城主
NVIDIA首席实行官黄仁勋十月刚刚担当了一场投资者的80分钟面谈专访。在这次最新长谈中,他用一如既往的风格,深入探究了人工智能范畴的最新发展,分享了对将来盘算架构的独到看法,以及NVIDIA在推动AI革掷中的战略结构。黄仁勋以独到的看法,为昨们深入展现了AI期间的机会与挑衅。
B站传送:【NVIDIA CEO黄仁勋最新十月长访@ BG2投资播客 2024.10.14【中英精校】-哔哩哔哩】
AI个人助理的将来触手可及
访谈一开始,主持人提出了一个令人奋发的愿景:拥有一个口袋里的私家AI助理,相识昨们的统统,具备完善的影象,可以或许与昨们沟通,帮助处置惩罚一样平常事件。对此,黄仁勋布满信心地表现,如许的助理将在不久的未来以某种情势出如今昨们身边,而且会随着时间的推移变得越来越完善。
黄仁勋的乐观态度反映了AI技能的迅猛发展。随着深度学习和天然语言处置惩罚的不停突破,AI个人助理的实现已不再是迢遥的空想,而是即将到来的实际。这将深刻改变人类的生存方式和工作模式。
重新发明盘算:Computing的革命性变革
黄仁勋夸大,昨们正在重新发明盘算。他指出,NVIDIA在已往十年中将盘算的边际本钱低落了10万倍,远超摩尔定律带来的百倍增长。这一结果源于加快盘算的引入,以及在GPU架构、数值精度、张量焦点等方面的创新。
他进一步表明,传统的CPU架构已无法满意AI期间的盘算需求。通过将CPU上服从不高的使命转移到GPU上,加快盘算成为大概。同时,软件、算法和硬件的同步创新,使得整个技能堆栈都在高速发展。
这一观点展现了NVIDIA在AI期间的战略上风。通过硬件和软件的深度融合,以及对整个盘算架构的重新计划,NVIDIA建立了其在AI盘算范畴的领先职位。这种革命性变革不但提拔了盘算性能,也为AI的快速发展奠基了底子。
深厚的护城河:从GPU到完备生态体系
在谈及NVIDIA的市场护城河时,黄仁勋指出,NVIDIA的上风不但在于硬件性能,更在于其构建的完备技能堆栈,尤其是软件和库的支持。他夸大,加快盘算的乐成离不开CUDA等范畴特定库的贡献。这些库使得开辟者可以或许高效使用GPU的性能,实现AI模子的快速练习和推理。
NVIDIA通过构建软硬件一体化的生态体系,形成了难以逾越的竞争壁垒。对开辟者友爱的平台和工具,加上连续的技能创新,使得NVIDIA在AI范畴保持领先。
推理的紧张性:AI应用的将来
随着AI模子的发展,黄仁勋夸大了推理(Inference)的紧张性。他以为,推理本质上是大规模的练习,只有在推理阶段体现精彩,AI模子才气真正为用户带来代价。NVIDIA在推理方面的技能积聚和架构计划,使其可以或许高效支持复杂的推理使命。
推理阶段的性能直接关系到用户体验和AI应用的实用性。NVIDIA在推理范畴的上风,进一步巩固了其在AI全财产链的主导职位。
面临竞争:对峙独特任务
对于市场上定制ASIC的竞争,黄仁勋坦言NVIDIA的目的与众差别。他表现,NVIDIA专注于构建实用于AI、天生式AI和署理AI的新盘算平台,重塑整个盘算堆栈。他夸大,公司唯一的目的是构建一个无处不在的平台架构,而不是从他人手中夺取市场份额。
这种战略定位彰显了NVIDIA的自大和远见。通过专注于自身的独特任务,NVIDIA致力于连续创新,引领AI期间的发展方向。竞争者的存在反而引发了NVIDIA不停进步的动力。
需求与挑衅:AI盘算的规模化
谈及将来的需求,黄仁勋猜测,环球将必要数百万个GPU来支持AI盘算。他以Elon Musk的X公司在19天内建成10万GPU的超等盘算机为例,展示了AI盘算需求的爆炸式增长。他以为,分布式盘算和新算法的发明将使得大规模AI盘算成为大概。
这反映了AI财产的巨大潜力和面对的挑衅。怎样满意云云巨大的盘算需求,既是技能题目,也是财产机会。NVIDIA在盘算加快和架构优化方面的上风,使其有本领引领这一波海潮。
AI对社会和生产力的影响,AI安全
黄仁勋笃信,AI不会代替人类,而是会改变每一项工作。他预见将来的企业将由生物员工和数以百万计的AI助手构成,生产力将实现质的飞跃。他夸大,AI将资助人们实现主动化,引发创造力,并推动经济增长。
在谈到AI安全时,黄仁勋夸大了行业自律的紧张性。他指出,构建安全的AI必要技能研发、最佳实践和适度的羁系。别的,他以为开源模子对于AI的发展至关紧张,开放与闭源应相辅相成,共同推动技能进步。
这一观点刻画了AI与人类共生的将来图景。AI作为工具和同伴,将解放人类的潜能,促进社会的进步。同时,也提出了对于教诲、就业和伦理的思索。AI的安全和伦理是不可回避的题目。通过行业互助和透明度的提拔,可以有用防备潜伏风险。开源精力的对峙,将有助于引发创新,促进AI在各范畴的公平应用。
--天空之城书面全文版2万字--
(媒介)黄仁勋:
他们取得的成绩是独一无二的,这是亘古未有的。从另一个角度看,100,000 个 GPU 绝对可以称为地球上最快的超等盘算机。这是一个超等盘算机集群。通常,制作如许一台超等盘算机必要三年的规划时间,装备交付后还必要一年的时间才气完全运作。而昨们,仅用了19天。
主持人:Jensen,你的眼镜不错。
黄仁勋:嘿,是的,你的也不错。
主持人:和你在一起真好。
黄仁勋:我也戴着雷同的眼镜。
主持人:好吧,它们并不丑,还算不错。更喜好赤色的吗?
黄仁勋:只有你的家人会喜好的东西。
主持人:本日是10月4日星期五,昨们在Nvidia总部。
黄仁勋:接待!
主持人:
谢谢。周一昨们将举行年度投资者集会,昨们将在会上讨论人工智能的全部影响,以及昨们扩展智能的速率。我真的想不出比你更得当开始集会的人了。我很感激。作为股东和头脑同伴,昨们往返交换想法,你真的让昨们变得更智慧。昨们非常珍视这段交情,感谢你的到来。
黄仁勋:很高兴来到这里。
主持人:
本年的主题是将智能扩展到AGI。令人难以置信的是,两年前昨们做这件事时,人工智能正处于一个紧张时期,而那照旧ChatGPT问世的两个月前。想想全部这些变革。以是我想,昨们可以从一个头脑实行和猜测开始。
假如我把AGI想象成我口袋里的私家助理,那将是多么美好。是的,它相识我的统统,对我有完善的影象,它可以与我沟通,帮我预订旅店或预约大夫。当你看到当当代界的变革速率时,你以为昨们什么时间才气拥有如许的个人助理?
黄仁勋:
很快,以某种情势,是的。很快就会以某种情势出现,而且随着时间的推移,这个助手会越来越好。这就是昨们所知的技能之美。以是我以为一开始它会非常有效,但并不完善。然后它会随着时间的推移变得越来越完善,就像全部的技能一样。
主持人:
当昨们观察变革的速率时,我想起埃隆曾说过,唯一真正紧张的是变革的速率。昨们确实感受到变革的速率已经明显加速。这是昨们在这些题目上见过的最快速率,由于昨们和你一样,在AI范畴已经耕耘了十年。这是您职业生活中见过的最快速率吗?
黄仁勋:
这是由于昨们重新发明白盘算。昨们在10年内将盘算的边际本钱低落了100,000倍,而摩尔定律的增长约为100倍。昨们通过多种方式告竣这一目的,包罗将CPU上服从不高的工作放在GPU上完成,引入加快盘算,发明新的数值精度,以及通过新的架构、张量焦点来实现。
体系构建的底子包罗利用NVLink增长超快的内存、HBM,并通过NVLink和InfiniBand扩展整个堆栈。这些创新导致了雷同超摩尔定律的增长速率。昨们从人工编程转向呆板学习,呆板学习可以或许快速学习。昨们重新分配盘算方式,实现了多种并行性,如张量并行性和管道并行性,并在此底子上发明新算法和新练习方法。这些创新不停叠加。
回首摩尔定律的发展,软件通常是静态的,是预编译和包装后出售的,而硬件则以摩尔定律的速率发展。如今,整个科技堆栈都在同步增长和创新。因此,昨们忽然看到体系的扩展。从前,昨们讨论预练习模子的扩展,以及怎样将模子巨细和数据巨细翻倍,使得所需盘算本领每年增长四倍。这是一个庞大变革。现在,昨们也看到了后练习和推理阶段的扩展。预练习再也不被视为艰巨,推理也变得复杂。以为人类全部头脑都是一次性想法是谬妄的,因此必要快速思索、慢速思索、推理、反思、迭代和模仿的本领。
主持人:
我以为,到现在为止,关于NVIDIA最轻易被误解的一点是它真正的护城河有多深。很多人大概以为只要有人发明白一种新的更好的芯片,他们就可以或许胜出。在已往十年中,你不停致力于构建从 GPU 到 CPU 再到网络的完备技能堆栈,尤其在软件和库方面,使应用步伐可以或许在 NVIDIA 上乐成运行。
当你思索 NVIDIA 当今的市场护城河时,你以为相比三四年前,它是变得更大照旧更小了?
黄仁勋:
我非常欣赏你对盘算技能发展变革的认知。很多人以为计划一个更好的芯片就是增长更多的触发器、位和字节,但这现实上是一种过期的头脑。恒久以来,昨们的明白是,软件只是运行在 Windows 上的某个应用步伐,而且是静态的。已往,人们以为进步体系性能的最佳途径是制造更快的芯片,但昨们已经熟悉到呆板学习并非由人类编程,它不但仅是软件,它涉及整个数据处置惩罚过程。
对昨们而言,呆板学习的关键在于“飞轮效应”。那么,怎样启用这个飞轮,同时让数据科学家和研究职员在此中高效工作呢?这个飞轮自一开始就运转不息。许多人乃至未曾意识到,教会人工智能必要先使用人工智能去整理数据,而人工智能自己极为复杂且在不停进步。
主持人:
它是否也在加快发展?而这种发展,是全部体系相联合的效果。
黄仁勋:
是的 ,由于智能化的数据整理技能,昨们现有合成数据天生及多种数据处置惩罚、出现方式。因此,高效的数据处置惩罚在练习之前就已经开始。人们大概以为 PyTorch 是新期间的出发点,但在 PyTorch 出现之前和之后都有大量工作要完成。要专注于飞轮的团体,这是你应该思量的重点。怎样计划盘算体系和架构,以使用飞轮并实现最高效运作呢?这并不是应用步伐的一部门,也不但是练习。这只是一个过程中的一步。飞轮上的每一步都很艰巨。因此,起首要做的不是思量怎样加速 Excel 或 Doom 的运行速率,那都是已往的事变。如今必要思索的是,怎样让飞轮运转得更快。这个飞轮由很多差别的步调构成。
正如各人所知,呆板学习并不轻易。OpenAI、X、Gemini 和 DeepMind 团队所做的工作都是复杂的。以是,昨们决定关注真正值得思索的题目:整个过程怎样加快。加快每一部门是目的,而遵照阿姆达尔定律至关紧张。阿姆达尔定律指出,假如某个步调占用30%的时间,纵然加快三倍,团体过程的提拔也有限。以是,创建一个可以加快每一步的体系是关键,只有如许才气实质性地改善周期时间。
飞轮和学习率是导致指数级增长的缘故原由。昨们对公司及实在际工作的明白终极会表现在产物中。昨们的目的是在整个周期中加快飞轮的运转。当前的重要关注点是视频范畴,许多人专注于物理人工智能和视频处置惩罚。想象一下每秒都有 TB 级数据进入体系,这必要一个能吸取全部数据的管道来起首为练习做好预备。
整个过程都是通过 CUDA 加快的。
主持人:
本日,人们大多只思量文本模子,但将来的视频模子以及一些文本模子,比方 O1,将可以或许在昨们到达目的前真正处置惩罚大量数据。
黄仁勋:
语言模子将无所不包,练习这些大型语言模子必要业界巨大的技能积极。如今,昨们在每一步中都利用大型语言模子,这非常了不得。
主持人:
固然不想简化这个过程,但经常会听到投资者问,定制 ASIC 的题目呢?是的,但他们的竞争模式将因此受到打击。
我听到您说,在组合体系中,上风会随着时间的推移而增长。以是,昨们的上风比三四年前更大,由于昨们正在改进每个组件,这是组合的结果。
当你思量,比方,作为一个贸易案例研究,英特尔,它拥有主导模式,在堆栈中占据主导职位。
黄仁勋:
他们之以是与众差别,是由于大概是第一家在制造、工艺工程、制造以及制造之上的芯片制造方面都非常精彩的公司。他们在 x86 架构中计划芯片、构建芯片,并制造出越来越快的 x86 芯片,这就是他们的智慧之处。他们将其与制造融合在一起。
昨们公司在这方面略有差别,昨们熟悉到随并行处置惩罚并不要求每个晶体管都体现精彩,而串行处置惩罚要求每个晶体管都性能杰出。并行处置惩罚必要大量的晶体管才气更具本钱效益。我甘心晶体管数目多10倍、速率慢20%,也不肯晶体管数目少10倍、速率快20%。这有原理吗?它们是相反的。
因此,单线程性能、单线程处置惩罚和并行处置惩罚非常差别。昨们观察到,究竟上,昨们的天下并不是越往下越好。昨们盼望变得非常好,尽大概好,但昨们的天下现实上是越往上越好。并行盘算、并行处置惩罚很难,由于每个算法都必要一种差别的方式重构和重新计划架构算法。
人们没故意识到的是,你可以拥有三个差别的ISA(指令集架构)、CPU ISA。它们都有本身的C编译器,你可以利用软件并编译到该ISA。这在加快盘算中是不大概的,这在并行盘算中是不大概的。提出架构的公司必须提出本身的OpenGL。
因此,昨们依附名为CUDNN的范畴特定库彻底改变了深度学习。假如没有CUDNN,就没有人谈判论它,由于它是PyTorch和TensorFlow下面的一层,在已往,它是CAFE和Theano,如今是Triton。有许多差别的框架。因此,特定范畴的库CUDNN、特定范畴的库Optics,昨们有特定范畴的库CuQuantum、Rapids,范畴列表继承增长。
主持人:
行业特定的算法位于全部人都关注的 PyTorch 层之下。正如我常听到的...
黄仁勋:
假如没有发明 LLM,那么上面的任何应用步伐都无法运行。NVIDIA 之以是精彩,正是由于昨们在数学和算法方面的上风。在科学和底层架构的联合上,昨们同样非常善于。
主持人:
如今,全部留意力终于会合在推理上。我记得,两年前,布拉德和我与你共进晚餐,曾问了一个题目:你以为在推理方面的护城河会像在练习方面一样强盛吗?
黄仁勋:我确信它会更大。
主持人:你刚才提到了许多元素,好比可组合性等。对于客户来说,在两者之间保持机动性黑白常紧张的。既然昨们处于推理期间,你可否谈谈相干内容?
黄仁勋:
推理本质上就是大规模练习。因此,假如你练习得好,很大概推理也会很好。假如你在这个架构上构建它,纵然没有特殊的思量,它也会在这个架构上运行。固然可以针对其他架构举行优化,但由于已经在 NVIDIA 上构建,它至少会在 NVIDIA 上运行。
另一个方面是资源投资。当你练习新模子时,天然盼望利用最新的装备,这就留下了你昨天利用的装备,而这些装备非常得当推理。与 CUDA 兼容的新底子办法背后,有一系列免费装备和底子办法。昨们严酷确保兼容性,以便现有体系保持杰出。
同时,昨们投入大量精神重新发明新算法,以确保 Hopper 架构比购买时更好。昨们的底子办法因此连续高效。改进的新算法和新架构提拔了每一个已安装的底子,包罗 Hopper、Ampere,乃至 Volta。Sam 刚刚告诉我,他们近来才停用了 OpenAI 的 Volta 底子办法。因此,我以为昨们已经为安装底子打下了陈迹。就像全部盘算一样,安装底子非常紧张。NVIDIA 的技能存在于每一个云,并不停延伸到边沿装备。因此,在云端创建的 Vela 视觉语言模子无需修改即可在呆板人的边沿完善运行,而且完全兼容 CUDA。
我以为架构兼容性对于大型体系来说至关紧张,无论是 iPhone 照旧其他装备。我信赖安装底子对于推理过程非常紧张。然而,真正让昨们受益的是,当昨们练习这些大型语言模子及其新架构时,昨们能思索如安在将来的某个机遇创建在推理方面体现精彩的架构。
因此,昨们不停在研究推理模子的迭代模子,以及怎样为用户的个人署理创建互动性强的推理体验。您不盼望在说完话之后还要等候半晌才气得到相应,您盼望它能快速与您互动。那么,昨们怎样创建如许的体系呢?终极的结果就是 NVLink。
NVLink 让昨们可以或许使用这些非常得当练习的体系,而在您完成练习后,推理性能也能到达非常精彩的程度。因此,优化到第一个标志的时间非常紧张。现实上,这一过程非常困难,由于到第一个标志的时间必要大量带宽。假如您的上下文也很丰富,那么您会必要大量的触发器。因此,您必要无穷量的带宽和触发器才气实现几毫秒的相应时间。
昨们为此发明白 Grace Blackwell NVLink。
主持人:
由于时间关系,这里另有更多题目。
黄仁勋:听着。让昨们不停做下去,直到做对为止。
主持人:
我喜好这种做法。如今昨们不必担心时间了。
本周早些时间我和安迪·贾西谋面,他提到昨们即将推出 Tranium 和 Inferencia。我以为大多数人大概以为这对 NVIDIA 是个题目。但他接着说,NVIDIA 是昨们的紧张互助同伴,并将继承是昨们的紧张互助同伴。据我所知,将来天下将依赖 NVIDIA 的技能运行。
因此,当您思量构建定制的 ASIC 时,它们将用于特定应用,好比 Meta 的推理加快器、亚马逊的 Tranium 大概谷歌的 TPU。关于供应短缺的题目,昨们必要思索这些新的技能动态是否会改变近况,大概它们是否只是对现有体系的一种增补。
黄仁勋:
昨们如今正在做的是差别的事变,详细来说,NVIDIA 正在为一个全新的天下构建盘算平台,这个天下包罗呆板学习、天生 AI 和署理 AI 等。
颠末 60 年的盘算,昨们深刻地重塑了整个盘算堆栈。无论是从编程到呆板学习,照旧从 CPU 向 GPU 的变化,以及从传统软件到人工智能的演变,应用步伐的情势都在改变。因此,盘算堆栈和技能堆栈的各个方面都发生了剧变。
昨们的目的是创建一个可以随时随地利用的盘算平台,这正是昨们工作复杂性的源泉。昨们正在构建整个人工智能底子办法,并将其视作一台完备的盘算机。我曾说过,如今的数据中央是盘算的单元。当我想到一台盘算机时,关注的不但是芯片,而是整个体系:全部的软件、编排和内部的呆板,构成了我的盘算机。
昨们每年都在积极创造一台新的盘算机,其性能提拔两到三倍,本钱低落两到三倍,能源服从进步两到三倍。这种进步令人难以置信。因此,昨们发起客户逐年分批购买新装备,以维持在本钱上的均匀程度,如许做的利益是在架构上保持兼容性。
现在,以昨们如许的改进速率来构建单独的体系黑白常困难的,而且双重困难之处在于,昨们不但仅将这些创新作为底子办法或服务出售,而是将它们全部门解并集成到多个平台中,好比 GCP、AWS、Azure 和其他服务中。这种做法确实是故意义的。每个人的集成都各不雷同。昨们必须将全部的架构库、算法和框架集成到他们的体系中,包罗昨们的安全体系和网络。昨们根本上每年都举行十次如许的集成。
这就是古迹。这种每年的实验让我感到疯狂,想想这件事我就将近疯了。
主持人:
那么,是什么驱策你每年如许做呢?
克拉克刚刚从台北、韩国和日本返来,与你们全部的供应同伴碰面,你们与他们有长达十年的关系。这些关系对于构建竞争护城河的组合数学有多紧张?
黄仁勋:
当你体系地分解时,越是分解,各人就越惊奇于整个电子生态体系怎样致力于与昨们互助,以构建一个集成到全部差别生态体系中的盘算机立方体,并实现无缝和谐。昨们向后流传了 API、方法、业务流程和计划规则,同时向前流传方法、架构和 API,这些已经固化并随着昨们的发展而不停演变。
这些 API 必须联合在一起,末了,台湾和天下各地制造的全部东西都会在 Azure 数据中央联合在一起。
主持人:
人们只需调用 OpenAI API,它就可以工作。
黄仁勋:
没错。这是一个完备的链条,是昨们发明的巨大盘算底子办法。整个地球都在与昨们互助,它已经融入每一个地方。
该体系可以通过戴尔和 HPE 贩卖,托管在云端,并不停靠近边沿。如今,人们在呆板人体系和主动驾驶汽车中利用它,它们在架构上都是兼容的。相称疯狂。
克拉克,我不想让你以为我没有答复这个题目。究竟上,我答复了。关于ASIC的部门,我指的是昨们正在做一些差别的事变。作为公司,昨们盼望相识详细环境,而且我对公司和生态体系四周的统统都洞若观火。我清晰其他人在做什么,偶然这对昨们有利,偶然则否则。我非常清晰这一点,但这并没有改变公司的目的。公司的唯一目的是构建一个可以或许无处不在的平台架构。
NVIDIA的定位是做市商,而非从任何人那边夺取市场份额。假如你检察昨们的幻灯片,会发现昨们从不评论市场份额。内部讨论的都是昨们怎样创造下一个事物?下一个可以在飞轮中办理的题目是什么?怎样更好地为人们服务?怎样将已往大概必要一年的飞轮收缩到一个月?在思量这些差别事变的同时,昨们确信昨们的任务非常独特。唯一的题目是这项任务是否须要。
全部巨大的公司都应该以任务为焦点,关键在于你在做什么,以及这是否须要、是否有代价、是否具有影响力和资助他人。我信赖你作为一家天生式人工智能初创公司的开辟职员,正在决定怎样成为一家公司。你不必立刻选择支持哪家ASIC,选择Akuta意味着你可以随时改变主意,而昨们是通往人工智能天下的入口。一旦你决定参加昨们的平台,其他决定可以推迟。在与全部GCP、Azure互助时,昨们也提前几年向他们展示昨们的门路图,他们从未向昨们展示他们的ASIC门路图,但这从未得罪过昨们。假如您有一个唯一且故意义的目的,而且您的任务对您和他人都很贵重,那么您就可以保持透明。我在 GTC 上的门路图是公开的,而在 Azure、AWS 等方面的互助同伴看到的门路图则更加深入。昨们在这些平台上的工作没有题目,纵然他们也在制造本身的 A6。
主持人:
我以为,当人们关注业务时,会说近来对 Blackwell 的需求是疯狂的。在工作中,最困难的部门之一是在无法提供充足的盘算资源时对人们说“不”,这会带来情绪上的负担。然而,品评者以为这只是临时征象,就像 2000 年的思科一样,以为昨们在过分建立光纤,预示着繁荣与冷落并存。
令我想起了 2023 年初的一次晚宴。在 1 月 23 日的晚宴上,NVIDIA 猜测 2023 年的收入将到达 260 亿美元,然而终极收入为 600 亿美元。
黄仁勋:
老实地说,这是汗青上最大的猜测失败之一,昨们是否至少可以认可这一点?这是我的见解。
主持人:
在 2022 年 11 月,昨们非常高兴,由于 Inflection.AI 的 Mustafa 和 Character.AI 的 Noah 等人来访,讨论对他们公司的投资。他们提到,假如不能投资他们的公司,那就投资 NVIDIA 吧,由于环球都在利用 NVIDIA 芯片来开辟大概改变天下的应用步伐。固然,寒武纪时候出如今 ChatGPT 上。然而,当时的 25 位分析师过于专注于加密钱币赢家,以至于无法察觉天下上的变革。终极,事变变得更大了。
您以简朴的语言形貌了对 Blackwell 的需求极其茂盛,并以为这种环境将连续下去。固然,将来是未知的。那么,为什么品评者会错误地预判这不会是像思科 2000 年那样的过分建立呢?
黄仁勋:
思索将来的最佳方式是从第一原则出发举行推理。那么,昨们正在做的事变的第一原则是什么?起首,昨们在做什么?答案是,昨们正在重新发明盘算。昨们刚才提到,将来的盘算方式将高度依靠于呆板学习。险些昨们所做的统统,每一个应用步伐,如Word、Excel、PowerPoint、Photoshop、Premiere、AutoCAD等,都会高度呆板学习化。岂论你如今利用的应用步伐多么手工化,我可以包管,将来它也将转向呆板学习化。
全部这些工具的紧张性在于,你将拥有呆板和智能署理来资助你利用它们。昨们的盘算方式已经被重新发明,不会转头。整个盘算技能堆栈已经被改造。因此,昨们预见软件的开辟、内容和利用方式将会有所差别。这是昨们当前的基本领实。
接下来昨们要思索的是,会发生什么变革?回首已往,昨们曾经有代价一万亿美元的盘算机体系。其时昨们大概会思索,这些体系是否是昨们必要的?放到将来的配景下,答案显然是否定的。昨们已往的数据中央拥有大量的CPU,昨们知道它们的本领和限定。如今,昨们必要将这些代价一万亿美元的数据中央举行当代化改革,这是公道和明智的步调。
在与那些必要举行当代化改革的人举行对话时,他们正在利用GPU举行这一变化。那么,假如你有500亿美元的资源付出选择,你会选择选项A或B?是为将来构建资源付出,照旧像已往一样?如今,已往的资源付出已经摆在那边,摩尔定律险些走到了止境。因此,昨们必要拿出500亿美元,投入到天生式人工智能中,这会使你的公司更具竞争力。我会投入500亿美元的全部,由于我已经有了四年的底子办法,这是已往的投资。如今,我是从第一原理思索出发来推理,这是他们正在做的事变。智慧人做智慧事。接下来,昨们有代价一万亿美元的产能可以建立,以及代价数万亿美元的底子办法。投入1500亿美元怎么样?对。昨们在将来四、五年内有代价一万亿美元的底子办法要建立。
昨们留意到的第二件事是,软件的编写和利用方式都在变革。将来,昨们将有署理,另有数字员工。在收件箱里你会看到这些小点和小脸,将来会出现人工智能的小图标。我不再用C++来编程盘算机,而是用提示来编程AI。
这与我一样平常的沟通方式没什么差别。本日早上,我写了许多电子邮件,提示我的团队。我要形貌配景、根本限定和使命,并充实引导他们,以便相识我的需求,尽大概清晰地沟通预期效果。同时,我留出了充足的含糊空间和创意空间,让他们可以或许带给我惊喜。这和我提示人工智能的方式没有什么差别。
在昨们要当代化的IT底子办法之上,将会有一个新的底子办法,即操纵这些数字人类的人工智能工厂。它们将全天候运行,昨们将为环球各地的公司提供它们。这些人工智能将存在于工厂和自主体系中。因此,天下必要创建一整层盘算布局,我称之为人工智能工厂,而这些在本日是不存在的。题目是,它有多大?现在还不知道,大概有几万亿美元。固然还没有明白答案,但令人奋发的是,昨们如今制作的新数据中央的当代化架构与人工智能工厂的架构雷同,这是一件功德。
主持人:
你已经说清晰了。你必须更新约莫一万亿的旧技能,同时至少有一万亿的新人工智能工作负载即未来临。
大抵来说,本年你的收入将到达1250亿美元。有人曾经说过,公司的代价永久不会凌驾10亿美元。Tam,本日你坐在这里,假如你的市值是数万亿美元中的1250亿美元,那么将来的收入有什么来由不到达如今的两倍或三倍呢?有什么缘故原由让你的收入达不到这个程度吗?
黄仁勋:
如你所知,公司规模受限于市场的巨细,就像金鱼只能长到鱼塘的巨细。那么,昨们的市场是什么?这必要许多想象力。这就是做市商必要思量将来并创造新市场的缘故原由。回首已往并试图扩大市场份额是很困难的,由于市场份额的占据者只能做到这么大。然而,做市商的规模可以相称大。
我以为昨们的好运在于,从公司建立之初,昨们就必须创造一个市场来发展。其时,昨们正处于创造3D游戏PC市场的起步阶段。昨们根本上发明白这个市场、生态体系以及显卡的整个生态。为一个新的市场举行发明以便更好地服务,这对昨们来说非常天然。
主持人:
与创造新市场的人对话后,昨们轻微转向模子和OpenAI。正如你所知,OpenAI本周以1500亿美元的估值筹集了65亿美元。昨们都到场了此中,真的为他们感到高兴。他们的态度非常精彩,团队也体现得很好。据报道,他们本年的收入或业务收入将到达约50亿美元,来岁大概会到达100亿美元。假如你观察他们如今的业务,其收入约莫是谷歌初次公开募股时的两倍。他们每周均匀有2.5亿用户,昨们估计这也是谷歌初次公开募股时的两倍。
假如你思量业务的倍数,并信赖来岁会到达100亿美元,那么约莫是预期收入的15倍,雷同于谷歌和Meta初次公开募股时的倍数。想象一下,一家22个月前收入为零、每周均匀用户为零的公司。Brad对汗青洞若观火。
请与昨们谈谈OpenAI作为互助同伴对你的紧张性,以及OpenAI作为推动公众对人工智能熟悉和利用的紧张气力。
黄仁勋:
这是昨们这个期间最紧张的公司之一,是一家寻求AGI愿景的纯人工智能公司。无论其界说是什么,我并不以为界说和机遇完全紧张。我知道,随着时间推移,人工智能将拥有一个本领门路图,而这个门路图会非常壮观。在此过程中,早在它到达任何人的AGI界说之前,昨们就会充实使用它。
如今,昨们与数字生物学家、天气技能研究职员、质料研究职员、物理科学家、天体物理学家、量子化学家,以及视频游戏计划师、制造工程师、呆板人专家等各行业的紧张人物攀谈,扣问人工智能是否彻底改变了他们的工作方式。然后从中获取这些数据点,回过头来问本身,你想保持多大的猜疑态度?由于他们评论的不是人工智能有朝一日的概念性利益,而是如今就正在利用人工智能。
无论是农业技能、质料技能照旧天气技能,你选择你的技能范畴,选择你的科学范畴,人工智能正在资助他们推进工作。在每一个行业、每一个公司、每一所大学,人工智能正在以某种方式改变贸易。这真是难以置信,不是吗?昨们知道这一点。这种变革是云云真实,仿佛本日就正在发生。因此,我以为ChatGPT的引入标记着人工智能的觉醒,这是难以置信的。我欣赏他们的速率以及推动这一范畴发展的独特目的,这非常紧张。
主持人:
他们创建了一个经济引擎,可以为下一代模子的前沿发展提供资金。
我以为硅谷的许多人都开始同等以为,整个模子层正在走向商品化。Lama让许多人可以或许以非常低的本钱创建模子。在早期,昨们有许多榜样公司,如Character、Inflection、Cohere和Mistral。许多人质疑这些公司是否能在经济引擎上到达逃逸速率,从而继承为下一代提供资金。我个人以为,这就是昨们看到整合的缘故原由。Open AI显然已经到达了逃逸速率,他们可以为本身的将来提供资金。我不清晰其他很多公司是否能做到这一点。
这是对模子层近况的一个公平评估吗?就像在很多其他市场中一样,昨们将整合提供给那些负担得起而且拥有经济引擎和应用步伐的市场向导者,让他们可以或许继承投资?
黄仁勋:
起首,昨们要明确,模子和人工智能之间有根本的区别。模子是人工智能的根本要素,它是须要的,但不是充实的。人工智能具备一种本领,但题目是它用于什么目标。举例来说,主动驾驶汽车的人工智能与人类或呆板人的人工智能相干,但却并不雷同,这与谈天呆板人的人工智能相干但也不尽雷同。因此,昨们必须相识堆栈的分类。
在堆栈的每一层都有时机,但不是每一层都为每个人提供无穷的时机。如今,我要说的重点是可以将“模子”这个词更换为“GPU”。这现实上是昨们公司32年前的一项紧张观察。GPU、图形芯片或GPU与加快盘算之间存在着根本的区别。加快盘算与昨们在AI底子办法方面所做的工作差别。两者有关联,但并不完全雷同,它们是相互叠加的。在每一层的抽象中都必要差别的根本技能。善于构建GPU的人未必知道怎样成为一家加快盘算公司,只管有许多人都在构建GPU。昨们发明白GPU,但昨们不是唯逐一家制造GPU的公司。固然GPU无处不在,但它们并不是用于加快盘算的公司。很多人利用它们来举行应用步伐加快,但这与加快盘算公司差别。因此,非常专业的AI应用步伐大概会非常乐成,这就是MTIA。但它大概不是那种拥有广泛影响力和广泛本领的公司。你必须决定你想去那里。全部这些差别的范畴大概都有时机,但就像创建公司一样,你必须留意生态体系的变化以及随着时间的推移哪些东西会被商品化。你必要熟悉到什么是功能、什么是产物、什么是公司。
主持人:
固然,有新的市场进入者拥有资金、聪明和野心。比方,x.ai就是如许的一个公司。有报道称,我和Larry以及Elon共进晚餐,他们说服我提供100,000辆H100。他们在孟菲斯制作了一个大型超等集群。起首,因果关系是存在的。你以为他们创建超等集群的本领怎样?
有传言说他们想要别的100,000台H200,以扩大超等集群的规模。起首让昨们谈谈x和他们的理想以及取得的成绩。昨们是否已经到了200,000和300,000 GPU集群的期间?
黄仁勋:
答案是肯定的。昨们应当认可从概念产生,到为NVIDIA预备好装备的数据中央,再到启动、毗连并举行初次练习,这之间取得的成绩是不容小觑的。短时间内制作了一个巨大的工厂,接纳液体冷却、通电和允许,这黑白常了不得的。据我所知,天下上只有一个人能做到这一点,那就是Elon。他对工程、修建、大型体系和资源调配的明白是独一无二的,令人难以置信。然后,固然,他的工程团队也很精彩。软件团队、网络团队和底子办法团队都非常良好。埃隆对此深有领会。
从昨们决定出发的那一刻起,昨们与工程团队、网络团队、底子办法和盘算团队、软件团队一起举行了规划,提前做好全部预备,包罗全部底子办法、全部物流以及当天运来的大量技能和装备。NVIDIA 的底子办法和盘算底子办法以及全部这些技能都到场了练习。
用时19天。毫无疑问,没有人有富足的苏息。但起首,19天是不可思议的。从另一个角度看,你知道19天是多少天吗?这只是几个星期。没错。假如你亲眼眼见,你会发现利用的技能数目令人赞叹。全部的布线和网络架构,NVIDIA 装备的网络与超大规模数据中央的网络非常差别。
一个节点中的电线数目,盘算机背后的电线,令人难以置信地复杂。这项技能与全部软件的整合非常了不得。我非常感谢 Elon 和 X 团队,他们完成的工程工作、规划工作以及全部其他内容是独一无二的,从前从未有人做到过。
简朴来说,利用 100,000 个 GPU 作为一个集群,无疑是地球上最快的超等盘算机。制作一台超等盘算机通常必要三年的规划时间,然后必要一年的时间让装备全部运转起来。昨们在19天内完成了这项工作。
主持人:
这要归功于 NVIDIA 平台,整个流程都得到了强化。
黄仁勋:
统统都已经正常运转,另有大量的 X 算法、X 框架、X 堆栈等整合。但规划工作非常精彩。
主持人:
Elon 就是 N of one。在答复题目时,昨们提到了200,000 到 300,000 个 GPU 集群。没错。可以扩展到500,000吗?可以扩展到一百万吗?你的产物需求是否取决于它扩展到数百万?
黄仁勋:
末了一部门是否定的。我的感觉是分布式练习必须有用,而且分布式盘算将被发明。某种情势的团结学习和异步分布式盘算将会被发现,我对此非常热情和乐观。
固然,要意识到的是,已往扩展定律是针对预练习的。如今昨们已经转向多模态和合成数据天生。后练习的规模已经扩大到令人难以置信,包罗合成数据天生、嘉奖体系和基于强化学习的方法。推理扩展也到达了顶峰。
一个模子在答复之前大概已经举行了10,000次内部推理,完成了树搜刮、强化学习,乃至举行了一些模仿和反思。它大概查找了一些数据和信息,以是它的上下文大概相称大。这种范例的智能就是昨们所做的。
因此,假如您举行了盘算,并将其与模子巨细和盘算本领每年增长4倍的趋势相联合,那么这种本领和扩展就变得非常紧张。另一方面,需求在利用中连续增长。昨们是否以为必要数百万个GPU?毫无疑问,是的。
题目是,昨们怎样从数据中央的角度来构建它?这在很大水平上取决于数据中央的功率是千兆瓦照旧250兆瓦。我的感觉是,两者兼而有之。
主持人:
分析师总是关注当前的架构赌注,但这次发言最大的劳绩之一是,你正在思量整个生态体系和将来很多年。
由于NVIDIA正在扩展规模以满意将来的需求,并不是只依靠于一个拥有50万或一百万个GPU集群的天下。比及有了分布式练习,就会编写软件来实现它。
黄仁勋:
没错。记着,假如没有昨们七年前开辟的Megatron,这些大型练习工作的扩展就不大概实现。对。昨们发明白Megatron、Nickel、GPU Direct,以及RDMA相干的全部工作。这些希望使得管道并行变得简朴。全部正在举行的模子并行和分布式练习的突破,全部批处置惩罚等等,都是由于昨们在早期做出了积极。如今昨们正在为将来、下一代举行早期的工作。
主持人:接下来,我想谈谈Strawberry和O1。我恭敬你的时间。
黄仁勋:各位,我有富足的时间。
主持人:
你非常慷慨。
起首,我以为他们用O1签证来定名O1是很酷的。O1签证旨在招募天下上最良好、智慧的人才并将他们引入美国。我知道昨们都对此非常热衷。我喜好这个想法,就是创建一个可以思索的模子,把昨们带入可扩展智能的下一个条理。这是对如许一个究竟的致敬:正是那些通过移民来到美国的人,他们的团体聪明作育了昨们。固然,这也是关于外星聪明的。
固然,这统统由昨们的朋侪诺姆·布朗主导。他在Meta工作,曾到场Pluribus和Cicero项目。将推理时间推理作为可扩展智能的全新载体,与仅仅是创建更大的模子相比力,有多大意义?
黄仁勋:
意义庞大。我以为许多智能不能先验完成。许多盘算,以及盘算的重新排序,都无法先验完成。以是许多事变只能在运行时完成。
无论从盘算机科学照旧智能的角度来看,很多事变都必要配景、详细环境以及你所探求的答案范例。偶然,一个快速答案就充足了,这取决于答案的影响和利用性子。因此,有些答案可以让AI思索一个晚上,乃至一周。我完全可以想象本身向人工智能发送一个提示,告诉它,“思索一个晚上,来日诰日再告诉我你的最佳答案和来由。”从产物角度看,如今智能的细分将会有一次性的版本。固然,有些使命大概只必要五分钟。智能层会根据精确的用例选择符合的模子来办理这些题目。
主持人:
昨晚昨们利用了高级语音模式和 O1 预览,我正在辅导我儿子到场 AP 汗青测验。感觉就像天下上最好的 AP 汗青老师就在你身边思索这些题目,令人赞叹。
本日,你的40%收入来自推理,它在渐渐预备好了,由于有推理链的出现。这将带来十亿倍的增长。
黄仁勋:
很多人还没有完全明白这一点。昨们评论的行业正犹如工业革命,这是智能生产,将实现十亿倍的增长。
主持人:
因此,每个人都高度关注 NVIDIA,就像在更大型的模子上举行练习。纵然本日的收入是 50-50,将来将举行更多的推理。练习固然紧张,但推理的增长将远超练习。这险些不可思议其他环境。
黄仁勋:
昨们的目的是让人们终极能在社会中有所作为。因此,固然练习模子很紧张,但更紧张的是推断它们。
主持人:
你是否已经在本身的业务中利用推理链和O1之类的工具来改善本身的业务?
黄仁勋:
昨们本日的网络安全体系依靠于其自身的署理来运行。昨们有署理资助计划芯片,好比霍珀和布莱克威尔的出现都是依靠这些署理。昨们公司内部有 AI 芯片计划师、AI 软件工程师、AI 验证工程师等,由于昨们有本领,并盼望自行探索技能。
主持人:
当我本日走进大楼时,有人过来说,请扣问 Jensen 关于文化的题目。全部的统统都与文化痛痒相关。
在业务方面,昨们常常评论顺应性、服从,以及可以或许快速实行的扁平化构造和小型团队。NVIDIA 确实验事独特。每位员工每年创造的收入约为 400 万美元,利润或自由现金流约为 200 万美元。你创建了一种高效的文化,真正开释了创造力、创新、主人翁精力和责任感,冲破了传统的职能管理模式。各人都喜好评论你的那些直接部属。
使用人工智能是否能让你继承发挥超强创造力,同时又保持高效?
黄仁勋:
毫无疑问可以或许做到。我盼望有一天......NVIDIA 现在有 32,000 名员工。昨们在以色列的员工有 4,000 家庭,我盼望他们统统都好。我盼望 NVIDIA 有一天能成为一家拥有 50,000 名员工和 1 亿名流工智能助手的公司。这些 AI 将分布在各个群体中。
昨们将拥有一个完备的 AI 目次,这些 AI 在各自范畴体现精彩。昨们的收件箱也会装满与昨们互助的 AI 目次,昨们知道这些 AI 非常善于昨们的技能。因此,AI 将招募其他 AI 来办理题目。AI 将在 Slack 频道中相互交换,人类亦是云云。昨们将形成一个巨大的员工底子,此中一些是数字和 AI,另一些是生物的,我乃至盼望此中一些是 megatronics 的。
主持人:
从贸易角度来看,这照旧一个被严峻误解的概念。你刚刚形貌了一家公司,它的产出相称于一家拥有 15 万名员工的公司,但你仅用了 5 万名员工。
黄仁勋:没错。
主持人:
如今,你并没有说要开除全部员工。你仍在增长构造中的员工数目,但该构造的产出将大幅增长。
黄仁勋:
这经常被误解。人工智能不会代替人类,而是会改变每一项工作。对,人工智能将对人们对工作的见解产生巨大影响。让昨们认可这一点。对,人工智能有大概带来令人难以置信的利益。昨们必须构建安全的人工智能。很多人忽视了一点,当公司使用人工智能进步生产力时,大概表现为更好的收益或增长,大概两者都有。当这种环境发生时,首席实行官的下一步大概并不是裁人,由于公司在发展。昨们的想法比昨们能探索的更多,昨们必要 AI 来资助昨们思索,然后再实现主动化。人工智能可以资助昨们完成主动化的部门,也可以或许资助昨们思索题目。然而,这仍旧必要昨们去明白要办理的题目。这家公司必要办理哪些题目?昨们要选择这些想法,并找出主动化和扩展的方法。因此,随着服从进步,昨们将雇佣更多的人。
人们经常忘记这一点。假如你回首已往,很显然昨们本日的想法比200年前多得多。这就是为什么只管昨们在疯狂地实现主动化, GDP 更大,就业更多。
主持人:
这是昨们正在进入的这个时期的一个非常紧张的点。
第一,险些全部人类生产力和繁荣都是已往 200 年主动化和技能的副产物。从亚当·斯密到熊彼特的创造性粉碎理论,都可以看出已往 200 年人均 GDP 增长的图表,它不停在加快。
这让我想到一个题目。假如你看看 90 年代,美国的生产力增长率约莫是每年 2.5% 到 3%。进入 21 世纪后,这一速率放缓到 1.8% 左右。已往 10 年是生产力增长最慢的十年,这是昨们有记载以来最慢的速率。很多人在争论其缘故原由,但假如天下像你形貌的那样,昨们正处于人类生产力急剧扩张的边沿吗?
黄仁勋:
这是昨们的盼望。固然,昨们生存在这个天下上,因此昨们拥有直接的证据。昨们有直接的证据,证实无论是孤立的案例照旧个别研究职员,人工智能在以不可思议的超大规模推动科学探索。这表现了生产力的提拔。昨们以极高的速率计划出令人难以置信的芯片,其复杂性和盘算机复杂性呈指数级增长,而公司员工数目却没有相应增长,这是生产力的权衡尺度。
昨们开辟的软件质量连续提拔,这依靠于人工智能和超等盘算机的支持,而员工数目增长却险些是线性的,这同样表现了生产力的进步。在各种行业中,昨们可以抽查到相似的征象。我可以亲身验证,昨们在贸易范畴的变革无能否认。固然昨们大概会过分自顺应,但这些征象反映了昨们观察到的趋势,并大概在其他行业中得到表现。
毋庸置疑,智力是天下上最有代价的商品。如今,昨们正预备大规模生产它。每个人都必要明白,当被比本身良好的人工智能困绕时,会发生什么。这让我想起本身的职业生活,我有60个直接部属,他们之以是参加我的团队,是由于他们在各自范畴中是天下级的,而且他们的体现优于我。但我与他们可以或许无停滞地互动,并轻松计划和编程这些互动。这意味着每个人都将学会成为首席实行官,成为人工智能署理的首席实行官。他们将使用创造力、意志力和须要的推理本领来分解题目,从而编程这些人工智能,资助他们实现目的。
主持人:
你提到了人工智能的和谐和安全性,还提到中东正在发生的悲剧。昨们在天下各地拥有大量的自主权,很多人工智能正在被广泛应用。关于人工智能与安全的讨论尤为紧张,昨们必要确保人工智能的发展对人类来说是积极的净收益,而不是演酿成一个没有目标的反乌托邦。马克·扎克伯格曾指出,打败恶意人工智能的方法是让精良的人工智能更加先辈。
你怎样形貌昨们的观点,即昨们怎样确保这对人类来说是积极的净收益,而不是让昨们留在这个没有目标的反乌托邦天下中?
黄仁勋:
关于安全的对话确实很紧张,而且很好。
抽象的观点,这种将人工智能视为一个巨大的神经网络的概念性观点,并不是那么好。众所周知,人工智能和大型语言模子是相干的,但并不雷同。
起首,开放源码的人工智能模子非常关键,它答应整个研究社区、各行各业的企业共同到场,学习怎样使用和应用这种技能。其次,很多人低估了为保障人工智能安全而举行的技能研发。这些技能用于管理数据、练习和和谐人工智能、天生合成数据、扩展知识,并淘汰误导信息。别的,另有为画图、关照、护栏以及监督其他人工智能所创建的安全体系。
昨们正在为整个行业创建须要的底子办法,包罗方法论、红队、流程、模子卡、评估和基准测试体系等,全部这些都在敏捷发展之中。然而,这些积极经常被低估。
主持人:
外界很少意识到这些没有受到当局法规的逼迫,而是行业到场者为应对关键题目所自觉接纳的最佳实践。
黄仁勋:
昨们必须开始将人工智能视为一种工程体系,该体系必要从底子原理经心计划和彻底测试。
末了,羁系也是一大关注点。固然对紧张技能举行适度羁系是须要的,但须制止过分羁系,特殊是应用层面的羁系更为紧张。人工智能应该作为一种应用本领来对待,羁系应有助于其积极发展,而不是拦阻创新。
起首,各类机构如FAA、NHTSA、FDA等,无论怎么说,都是为了羁系技能应用而设立的。这些差别的生态体系现在必须规范融入人工智能的技能应用。因此,我以为昨们不能忽视为人工智能订定的大量法规,也不能依靠某个假造的宇宙银河人工智能委员会的管理。全部这些差别的羁系机构的建立都是有其缘故原由的。
主持人:
如今回到昨们的焦点理念。假如我不提及开源点,我的合资人比尔·格利大概会不高兴。你们推出了一个紧张且强盛的开源模子——Neutron,显然Meta也在为开源贡献气力。我在阅读Twitter时,看到关于开源与封闭的争论非常热烈。第一个题目是,你怎样对待本身的开源模子保持前沿本领?第二个题目是,你是否以为开源模式和推动贸易运营的闭源模式将是将来的发展方向?这两者是否会在安全上形成康健的告急关系?
黄仁勋:
开源与闭源确实和安全有关,但不但限于安全。好比,闭源模子作为经济模子的引擎毫无疑问是符合的,它对于维持创新是须要的。我完全支持这一点。我以为,把开源与闭源对立起来是不对的,它们应该是相辅相成的。开放是激活很多行业的须要条件。没开源的话,各类科学范畴怎样可以或许在人工智能上实现突破?
由于他们必要开辟特定范畴的人工智能,而这必要依靠开源模子的支持。而这些特定的人工智能体系必要开源模子来创建,它们是相干但差别的。仅仅拥有一个开源模子,并不意味着拥有了一个人工智能。因此,金融服务、医疗保健、交通运输等诸多行业,以及科学范畴,因有开源而得以实现创新。
末了,关于对开源模子的需求,昨们的开源模子起首是Llama,显然,Mark和他们的积极结果令人难以置信。Nemotron 的开辟让人感到超乎平常。昨们创建这个模子的目标是为了天生合成数据。外貌上看,一个人工智能坐在那边循环天生数据以自我学习好像不太可靠。在谁人无穷循环中能重复多少次值得猜疑。不外,我假想的景象是,像把一个超等智慧的人关进软垫房间一个月,效果未必是一个更智慧的人。然而,假如昨们将两三个人放在一起,共同差别的人工智能和知识分布,通干涉答互动,每个人都可以变得更智慧。
因此,昨们可以让人工智能模子举行互换、互动和辩说,并通过强化学习和合成数据天生等方式来提拔相互的本领。昨们的模子 Nemotron 340B 是天下上最良好的嘉奖体系模子,它在批驳分析上也极具上风。这使它成为加强其他模子的抱负选择。无论其他模子多么精彩,我都发起利用 Nemotron 340B 来举行提拔。这款模子已经证明白它能让 Llama 以及其他全部模子变得更好。
主持人:
作为曾在2016年交付DGX-1的人,这段路程着实不可思议且令人赞叹。您不光生存下来,而且在早期阶段取得如许的成绩黑白常了不得的。2022年,昨们迎来了科技的寒武纪时候。我常常被问到您能对峙做多久如许的题目。作为一个拥有60个直接部属并推动这场革命的人,您玩得开心吗?是否另有其他更乐意做的事变?
黄仁勋:
我可以肯定地说,我玩得很开心,我无法想象另有什么比如今所做的事变更让我乐意去做。但这并不意味着昨们的工作总是布满兴趣的,它并非总是如许,也没有指望它永久是云云。我对工作不停都很认真,也很器重昨们的责任和贡献。固然工作并不总是布满兴趣,但我不停很享受它。就像生存中的全部方面,无论是家人、朋侪照旧孩子,并不总是风趣,但昨们不停都深深地喜好着这统统。
关于工作的连续性,真正的题目在于我能保持相干性多久。而这取决于我怎样继承学习。现在,我对此更为乐观,部门缘故原由是人工智能的存在。我险些天天都在利用人工智能,全部的研究也都涉及到它。纵然我已经知道答案,也会通过人工智能反复查抄每个题目,以发现新的看法。
人工智能作为导师、助手和头脑风暴的同伴,可以或许资助反复查抄我的工作,这对于信息工作者而言是一场革命。我的输出是信息,这使我的社会贡献相称非凡。我盼望能保持这种相干性,继承做出贡献,由于这项工尴尬刁难我来说非常紧张,我想继承寻求。
我对现在的生存质量感到难以置信,并无法想象错过如许的时候。
主持人:
这是昨们职业生活中最紧张的时候之一。感谢这种头脑同伴关系,它让昨们变得更智慧。也感谢你作为向导层的一部门,引领这一历程。真的很喜好如许的互助。谢谢。
黄仁勋:
谢谢,干得好。