首頁(yè)>資訊 >
老黃數(shù)字人登場(chǎng),英偉達(dá)秀“元宇宙”肌肉,推巴掌大AI超算和虛擬化身平臺(tái) 2021-11-10 07:52:34  來(lái)源:36氪

芯東西11月9日?qǐng)?bào)道,今日,人工智能及高性能計(jì)算頂級(jí)技術(shù)盛會(huì)NVIDIA GTC大會(huì)如約而至。

這個(gè)市值已高達(dá)7700億美元的AI頂級(jí)玩家,剛剛推出全球最小、功能最強(qiáng)大、能效最高的下一代AI超級(jí)計(jì)算機(jī)NVIDIA Jetson AGX Orin,其算力達(dá)到200TOPS,可與內(nèi)置GPU的服務(wù)器媲美。

在下午的虛擬主題演講中,NVIDIA創(chuàng)始人兼CEO黃仁勛穿著熟悉的皮衣,公布了一系列最新AI技術(shù)和產(chǎn)品,并推出承載著其“元宇宙”愿景的全新虛擬化身平臺(tái)。

由這個(gè)平臺(tái)生成的“迷你玩具版黃仁 勛”Toy-Me,能與人 自然地問(wèn)答交流。

在幫助企業(yè)降低AI開(kāi)發(fā)部署門檻方面,NVIDIA可以說(shuō)是做到了極致,比如提供方便企業(yè)構(gòu)建AI大模型的框架,以及定制專屬聲音的虛擬助手。

黃仁勛說(shuō),NVIDIA開(kāi)發(fā)者數(shù)量已接近300萬(wàn),CUDA過(guò)去15年下載量達(dá)3000萬(wàn)次,一年下載量達(dá)到700萬(wàn)。

此外,NVIDIA繼續(xù)表露對(duì)醫(yī)療健康領(lǐng)域的熱情,推出搭載新一代Orin芯片、無(wú)縫連接醫(yī)療設(shè)備和邊緣服務(wù)器的AI計(jì)算平臺(tái)Clara Holoscan。

黃仁勛還宣布,NVIDIA將構(gòu)建一個(gè)數(shù)字孿生模型來(lái)模擬和預(yù)測(cè)氣候變化,新的超級(jí)計(jì)算機(jī)將名為E-2,即Earth Two,地球的數(shù)字孿生,能夠在虛擬世界模擬引擎Omniverse中以Million-X百萬(wàn)倍的速度運(yùn)行。

01.Jetson AGX Orin:手掌大小,算力堪比服務(wù)器

自2014年推出Jetson TK1至今,NVIDIA Jetson系列已經(jīng)積累了85萬(wàn)名開(kāi)發(fā)者。

今日,NVIDIA推出全球最小、功能強(qiáng)大、能效最高的新一代AI超級(jí)計(jì)算機(jī)NVIDIA Jetson AGX Orin,用于機(jī)器人、自主機(jī)器、醫(yī)療器械和其他形式的邊緣嵌入式計(jì)算。

Jetson AGX Orin保持了與前代機(jī)型Jetson AGX Xavier相同的外形尺寸和引腳兼容性,處理能力提升6倍,每秒算力達(dá)200TOPS,可與內(nèi)置GPU的服務(wù)器相媲美,而尺寸只有手掌那么大。

它采用NVIDIA Ampere架構(gòu)GPU、Arm Cortex-A78AE CPU以及新一代深度學(xué)習(xí)和視覺(jué)加速器。高速接口、更快的存儲(chǔ)帶寬和對(duì)多模態(tài)傳感器的支持,為多個(gè)并行AI應(yīng)用流水線輸送數(shù)據(jù)。

與歷代Jetson計(jì)算機(jī)一樣,使用Jetson AGX Orin的客戶可以運(yùn)用NVIDIA CUDA-X加速計(jì)算棧、NVIDIA JetPack SDK和最新NVIDIA工具進(jìn)行應(yīng)用開(kāi)發(fā)和優(yōu)化,包括云原生開(kāi)發(fā)工作流程。

來(lái)自NVIDIA NGC目錄的預(yù)訓(xùn)練模型已經(jīng)過(guò)優(yōu)化,并可以使用NVIDIA TAO工具套件和客戶數(shù)據(jù)集進(jìn)行微調(diào)。這減少了生產(chǎn)級(jí)AI的部署時(shí)間和成本,而云原生技術(shù)實(shí)現(xiàn)了產(chǎn)品整個(gè)生命周期內(nèi)的無(wú)縫更新。

DRIVE AGX Orin同樣由Jetson AGX Orin等 NVIDIA Ampere架構(gòu)提供支持,它是新發(fā)布的NVIDIA DRIVE Concierge和DRIVE Chauffeur背后的先進(jìn)處理器,這兩個(gè)AI平臺(tái)分別為安全的自動(dòng)駕駛提供動(dòng)力。

針對(duì)特定用例的軟件框架包括用于機(jī)器人技術(shù)的NVIDIA Isaac Sim,用于自動(dòng)駕駛的NVIDIA DRIVE,用于智慧城市的NVIDIA Metropolis。最新的Isaac版本包括對(duì)機(jī)器人操作系統(tǒng)(ROS)開(kāi)發(fā)人員社區(qū)的重要支持。

NVIDIA還發(fā)布了用于Isaac Sim的全新NVIDIA Omniverse Replicator,用于為機(jī)器人生成合成訓(xùn)練數(shù)據(jù)。這些硬件加速軟件包使ROS開(kāi)發(fā)者更容易在Jetson平臺(tái)上構(gòu)建高性能AI機(jī)器人。

NVIDIA Jetson AGX Orin模塊和開(kāi)發(fā)者工具包將于2022年第一季度上市。

黃仁勛還在演講中談道:“到2024年,絕大多數(shù)新款電動(dòng)汽車將具備強(qiáng)大的自動(dòng)駕駛能力?!?/p>

他展示了一個(gè)新自動(dòng)駕駛平臺(tái)DRIVE Hyperion 8 GA,這是2024年模型的架構(gòu)。其傳感器套件包含12個(gè)攝像頭、9個(gè)毫米波雷達(dá)、12個(gè)超聲波雷達(dá)和1個(gè)前向激光雷達(dá),所有這些都由2顆NVIDIA DRIVE Orin芯片來(lái)進(jìn)行處理。

據(jù)他透露,目前,英偉達(dá)已經(jīng)在全球各地收集到了PB級(jí)的道路數(shù)據(jù),并擁有大約3000名訓(xùn)練有素的標(biāo)記員,創(chuàng)建訓(xùn)練數(shù)據(jù)。盡管如此,合成數(shù)據(jù)仍是NVIDIA數(shù)據(jù)策略的基石。

02.NeMo Megatron:讓企業(yè)開(kāi)發(fā)自己的大模型

為了方便企業(yè)開(kāi)發(fā)部署大型語(yǔ)言模型,NVIDIA推出了為訓(xùn)練具有數(shù)萬(wàn)億參數(shù)的語(yǔ)言模型而優(yōu)化的加速框架NeMo Megatron。

NVIDIA NeMo Megatron是Megatron的基礎(chǔ)上發(fā)展起來(lái)的。Megatron是由NVIDIA研究人員主導(dǎo)的開(kāi)源項(xiàng)目,研究大型Transformer語(yǔ)言模型的高效訓(xùn)練。Megatron 530B是全球最大的可定制語(yǔ)言模型。

利用先進(jìn)的數(shù)據(jù)、張量和管道并行化技術(shù),它能使大型語(yǔ)言模型的訓(xùn)練有效地分布在成千上萬(wàn)的GPU上。

企業(yè)可以通過(guò)NeMo Megatron框架,進(jìn)一步訓(xùn)練它以服務(wù)新的領(lǐng)域和語(yǔ)言。經(jīng)優(yōu)化,該框架可以在NVIDIA DGX SuperPOD的大規(guī)模加速計(jì)算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。

除了NeMo Megatron外,NVIDIA還推出了一個(gè)開(kāi)發(fā)Physics-ML模型的框架NVIDIA Modulus。

它使用物理原理及源自原理型物理和觀測(cè)結(jié)果的數(shù)據(jù)訓(xùn)練Physics-ML模型,支持多GPU多節(jié)點(diǎn)訓(xùn)練,由此生成的模型,其物理仿真速度比模擬快1000-100,000倍。

科學(xué)家可借助Modulus創(chuàng)建數(shù)字孿生模型,來(lái)解決預(yù)測(cè)氣候變化等重要科學(xué)問(wèn)題。

例如研究人員利用歐洲中期天氣預(yù)報(bào)中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個(gè)A100 GPU上訓(xùn)練需要4小時(shí),訓(xùn)練后的模型能以30公里的空間分辨率預(yù)測(cè)颶風(fēng)嚴(yán)重程度和路徑。

原本需要7天才能完成的預(yù)測(cè),現(xiàn)在在一個(gè)GPU上只需0.25秒,比模擬快了10萬(wàn)倍。

為了幫助企業(yè)加快AI之旅,NVIDIA宣布在全球范圍內(nèi)擴(kuò)展其LaunchPad計(jì)劃,它允許用戶即時(shí)訪問(wèn)在加速基礎(chǔ)設(shè)施上運(yùn)行的NVIDIA AI軟件。企業(yè)可使用NVIDIA LaunchPad免費(fèi)體驗(yàn)開(kāi)發(fā)和部署大型語(yǔ)言模型。

LaunchPad計(jì)劃由Equinix服務(wù)支持,包括數(shù)據(jù)中心、連接和裸金屬產(chǎn)品,獲得LaunchPad體驗(yàn)后,企業(yè)可以在全球Equinix地點(diǎn)運(yùn)行其NVIDIA加速的人工智能工作負(fù)載。

03.Riva定制語(yǔ)音:快速創(chuàng)建定制版品牌聲音

NVIDIA的Riva語(yǔ)音AI軟件同樣有了新進(jìn)展,黃仁勛宣布了該軟件一個(gè)新功能——Riva定制語(yǔ)音。

Riva可識(shí)別英語(yǔ)、西班牙語(yǔ)、德語(yǔ)、法語(yǔ)、日語(yǔ)、普通話和俄語(yǔ)等7種語(yǔ)言,可以生成隱藏字幕、翻譯、摘要、回答問(wèn)題并理解意圖。

只需訓(xùn)練30分鐘的音頻數(shù)據(jù),企業(yè)即可構(gòu)建屬于自己品牌大使的聲音,獲得類似人類的表現(xiàn)力。

也就是說(shuō),用戶根據(jù)特定的領(lǐng)域或行業(yè)術(shù)語(yǔ),可以量身定制擁有獨(dú)特聲音的虛擬助理。

不到三年間,NVIDIA的對(duì)話AI軟件已被下載超過(guò)25萬(wàn)次,并被廣泛采用到各個(gè)行業(yè)。

對(duì)于小規(guī)模研發(fā),NVIDIA NGC容器注冊(cè)表免費(fèi)提供NVIDIA Riva,開(kāi)發(fā)者可加入Riva開(kāi)放測(cè)試版程序來(lái)試用該軟件。

對(duì)于擁有大規(guī)模部署并尋求NVIDIA專家技術(shù)支持的客戶,NVIDIA宣布了NVIDIA Riva Enterprise計(jì)劃,該計(jì)劃預(yù)計(jì)將于明年初推出。

04.Omniverse Avatar:構(gòu)建生動(dòng)的智能虛擬化身

虛擬助手的下一步,是擁有常識(shí)、推理能力和生動(dòng)的視覺(jué)形象。

在GTC大會(huì)上,黃仁勛宣布推出一個(gè)全方位的虛擬化身平臺(tái)——Omniverse Avatar。

它是NVIDIA一系列先進(jìn)AI技術(shù)的集大成者,將Metropolis的感知能力、Riva的語(yǔ)音識(shí)別能力、Merlin的推薦能力、Omniverse的動(dòng)畫渲染能力等交匯于一體。

這使得開(kāi)發(fā)者能構(gòu)建出一個(gè)完全交互式的虛擬化身,它足夠生動(dòng),能對(duì)語(yǔ)音和面部提示做出反應(yīng),能理解多種語(yǔ)言,能給出智能的建議。

黃仁勛展示了一些例子。

比如,其玩偶復(fù)制品可以跟人對(duì)答如流。

Metropolis工程師用Maxine創(chuàng)建了Tokkio智能操作臺(tái)應(yīng)用程序,讓操作臺(tái)具有高度交互性,可快速做出對(duì)話響應(yīng)。

在餐廳,兩名顧客點(diǎn)餐時(shí),一個(gè)客戶服務(wù)虛擬化身可以跟他們交談和理解他們的需求。

這些演示由NVIDIA AI軟件和Megatron 530B提供支持,Megatron 530B是目前世界上最大的可定制語(yǔ)言模型。

在DRIVE Concierge AI平臺(tái)的演示中,中央儀表板屏幕上的數(shù)字助理,可幫助司機(jī)選擇最佳駕駛模式,使其按時(shí)到達(dá)目的地,然后在汽車?yán)m(xù)航里程下降到100英里以下時(shí),按他的請(qǐng)求設(shè)置提醒。

Maxine項(xiàng)目更強(qiáng)調(diào)多種語(yǔ)言的實(shí)時(shí)翻譯和轉(zhuǎn)錄。

借助Maxine,這個(gè)人的話不僅被轉(zhuǎn)錄,還能以相同的聲音和語(yǔ)調(diào)被實(shí)時(shí)轉(zhuǎn)換成德語(yǔ)、法語(yǔ)等多種語(yǔ)言。

Maxine使用計(jì)算機(jī)視覺(jué)來(lái)追蹤人的面部,并識(shí)別其表情,3D動(dòng)畫可為其制作虛擬而逼真的頭像。

可以想象,在企業(yè)和開(kāi)發(fā)人員中,每個(gè)行業(yè)都需要某種形式的虛擬化身。

使用Omniverse Avatar平臺(tái),你可以為視頻會(huì)議和協(xié)作平臺(tái)、客戶支持平臺(tái)、內(nèi)容創(chuàng)建、應(yīng)用收益和數(shù)字孿生、機(jī)器人應(yīng)用等等構(gòu)建定制的AI助理。

NVIDIA的虛擬世界模擬Omniverse是打造虛擬世界的關(guān)鍵平臺(tái)。從機(jī)器人、自動(dòng)駕駛車隊(duì)、倉(cāng)庫(kù)、工業(yè)廠房到整個(gè)城市,都能在Omniverse數(shù)字孿生中完成創(chuàng)建、訓(xùn)練和運(yùn)行。

黃仁勛說(shuō),Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計(jì),有朝一日有望能達(dá)到全球數(shù)據(jù)規(guī)模。

愛(ài)立信正構(gòu)建整個(gè)城市的數(shù)字孿生環(huán)境,幫助確定如何放置和配置每個(gè)站點(diǎn)以獲得最佳覆蓋范圍和網(wǎng)絡(luò)性能,可對(duì)整個(gè)5G網(wǎng)絡(luò)執(zhí)行逼真遠(yuǎn)程仿真。

05.AI推理:Triton推理服務(wù)器助力實(shí)時(shí)大模型推理

目前微軟、三星、Snap等25000多家客戶都在使用NVIDIA的AI推理平臺(tái)。

今日,NVIDIA推出多節(jié)點(diǎn)分布式推理功能的NVIDIA Triton推理服務(wù)器,以及NVIDIA A2 Tensor Core GPU加速器。

NVIDIA A2 GPU是一個(gè)入門級(jí)、低功耗的緊湊型加速器,適用于邊緣服務(wù)器中的推理和邊緣AI,推理性能比CPU高出20倍。

NVIDIA AI推理平臺(tái)此次更新包括開(kāi)源NVIDIA Triton推理服務(wù)器軟件的新功能,和對(duì)NVIDIA TensorRT的更新。

最新NVIDIA Triton推理服務(wù)器中的多GPU、多節(jié)點(diǎn)特性,使大型語(yǔ)言模型推理工作負(fù)載能夠?qū)崟r(shí)在多個(gè)GPU和節(jié)點(diǎn)上擴(kuò)展。

借助Triton推理服務(wù)器,Megatron 530B能在兩個(gè)NVIDIA DGX系統(tǒng)上運(yùn)行,將處理時(shí)間從CPU服務(wù)器上的1分鐘以上縮短到0.5秒,令實(shí)時(shí)部署部署大型語(yǔ)言模型成為可能。

在軟件優(yōu)化上,Triton推理服務(wù)器的模型分析器,新工具可以自動(dòng)化地從數(shù)百種組合中為AI模型選擇最佳配置,以實(shí)現(xiàn)最優(yōu)性能,同時(shí)確保應(yīng)用程序所需的服務(wù)質(zhì)量。

RAPIDS FIL是針對(duì)隨機(jī)森林和梯度提升決策樹(shù)模型GPU或CPU推理的新后端,為開(kāi)發(fā)者使用Triton進(jìn)行深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)提供了一個(gè)統(tǒng)一的部署引擎。

Triton與AWS、阿里云等平臺(tái)集成,并支持在各代GPU、x86 CPU和Arm CPU上優(yōu)化AI推理工作負(fù)載。NVIDIA AI Enterprise也集成了Triton。

NVIDIA AI Enterprise是一款經(jīng)NVIDIA優(yōu)化、認(rèn)證和支持的用于開(kāi)發(fā)和部署AI的端到端軟件套件,客戶可利用它在本地?cái)?shù)據(jù)中心和私有云的主流服務(wù)器上運(yùn)行AI工作負(fù)載。

NVIDIA旗艦TensorRT推理引擎亦進(jìn)行了更新,已原生集成到TensorFlow和PyTorch中,只需1行代碼,就能提供比框架內(nèi)推理快3倍的性能。

NVIDIA TensorRT 8.2是SDK的最新版本,可實(shí)時(shí)運(yùn)行數(shù)十億個(gè)參數(shù)的語(yǔ)言模型。

NVIDIA還宣布微軟會(huì)議軟件Teams采用NVIDIA AI和Azure認(rèn)知服務(wù)。

微軟Azure認(rèn)知服務(wù)為高品質(zhì)AI模型提供基于云的API,以創(chuàng)建智能應(yīng)用程序。他們?cè)谟肨riton運(yùn)行語(yǔ)音轉(zhuǎn)文本模型,為微軟Teams用戶提供準(zhǔn)確的實(shí)時(shí)字幕和轉(zhuǎn)錄。

微軟Teams每月有近2.5億活躍用戶,微軟Azure認(rèn)知服務(wù)上的NVIDIA GPU和 Triton推理服務(wù)器使用28種語(yǔ)言和方言,結(jié)合AI模型幫助提升實(shí)時(shí)字幕和轉(zhuǎn)錄功能的成本效益。

Mavenir宣布由NVIDIA Metropolis AI-on-5G平臺(tái)提供支持的MAVedge-AI智能視頻分析,以加速企業(yè)人工智能,該方案預(yù)計(jì)2022年初提供給客戶。

06.數(shù)據(jù)中心:全新網(wǎng)絡(luò)安全功能

面向數(shù)據(jù)中心,黃仁勛宣布推出BlueField DOCA 1.2來(lái)支持全新網(wǎng)絡(luò)安全功能,希望使BlueField成為業(yè)界構(gòu)建零信任安全平臺(tái)的理想之選。

目前有1400名開(kāi)發(fā)者正在BlueField上進(jìn)行開(kāi)發(fā),現(xiàn)在采用BlueField的網(wǎng)絡(luò)安全公司已可提供零信任安全即服務(wù)。

NVIDIA還發(fā)明了一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺(tái)Morpheus來(lái)監(jiān)控分析網(wǎng)絡(luò)行為。

它構(gòu)建于NVIDIA RAPIDS和NVIDIA AI之上,其工作流會(huì)為每種應(yīng)用和用戶的組合創(chuàng)建AI模型和數(shù)字指紋,并學(xué)習(xí)其日常的模式和尋找異常操作。這些異常操作將觸發(fā)安全警告,并提醒分析員作出響應(yīng)。

Bluefield、DOCA和Morpheus都是數(shù)據(jù)中心的全堆棧加速AI解決方案的一部分。NVIDIA將為其網(wǎng)絡(luò)安全合作伙伴提供一個(gè)零信任的安全平臺(tái),從而提高安全性和應(yīng)用程序性能。

Bluefield坐在網(wǎng)絡(luò)上,向Morpheus AI平臺(tái)提供數(shù)據(jù)中心發(fā)生的所有活動(dòng)。Morpheus是一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺(tái),可以監(jiān)控和分析來(lái)自每個(gè)用戶、機(jī)器和服務(wù)的所有信息。

NVIDIA今日也宣布了Morpheus早期訪問(wèn)2版本。

Morpheus創(chuàng)建了預(yù)訓(xùn)練的用戶活動(dòng)指紋模型。當(dāng)這些指紋發(fā)生變化時(shí),它能夠?qū)崟r(shí)識(shí)別出異常交易正在發(fā)生,創(chuàng)建一個(gè)可疑行為正在發(fā)生的安全警報(bào),并隔離活動(dòng)和加以提醒。

07.醫(yī)療健康:合作癌癥中心,推新機(jī)器人平臺(tái)

在醫(yī)療健康領(lǐng)域,NVIDIA宣布與多家先進(jìn)癌癥中心合作,將AI的力量帶到癌癥治療。這些癌癥中心將采用NVIDIA DGX來(lái)加速開(kāi)發(fā)AI模型。

許多醫(yī)療設(shè)備公司正在將AI和機(jī)器人技術(shù)融入其中,在機(jī)器人手術(shù)、移動(dòng)CT掃描、支氣管鏡檢中使用NVIDIA加速計(jì)算平臺(tái)。

為加速AI醫(yī)療設(shè)備的應(yīng)用,NVIDIA推出一個(gè)面向醫(yī)療健康行業(yè)的新計(jì)算平臺(tái)NVIDIA Clara Holoscan。

Holoscan是繼Isaac和Drive后,NVIDIA的第三個(gè)機(jī)器人平臺(tái),能為可擴(kuò)展、軟件定義、端到端流媒體數(shù)據(jù)處理的醫(yī)療設(shè)備提供所需的計(jì)算基礎(chǔ)設(shè)施。

該平臺(tái)集成了NVIDIA AGX Orin和ConnectX-7,F(xiàn)P32算力達(dá)5.2TFLOPS,AI算力達(dá)250TOPS,740Gbps高速IO用于連接傳感器。

添加RTX A6000 Ampere GPU后,可獲得另外39TFLOPS(FP32)和超過(guò)600TOPS的AI推理性能。

Clara Holoscan是一個(gè)醫(yī)療設(shè)備與邊緣服務(wù)器無(wú)縫連接的端到端平臺(tái),能助力開(kāi)發(fā)者創(chuàng)建AI微服務(wù),用以在設(shè)備上運(yùn)行低延遲串流應(yīng)用,同時(shí)將更復(fù)雜的任務(wù)傳至數(shù)據(jù)中心資源。

借助Clara Holoscan,開(kāi)發(fā)者可以自定義應(yīng)用,按需在其醫(yī)療設(shè)備中充分添加或減少計(jì)算和輸入/輸出功能,從而平衡延遲、成本、空間、性能和帶寬的需求。

Clara Holoscan SDK通過(guò)加速庫(kù)、AI模型和超聲波、數(shù)字病理學(xué)、內(nèi)窺鏡檢查等參考應(yīng)用支持此項(xiàng)工作,以幫助開(kāi)發(fā)者利用嵌入式和可擴(kuò)展的混合云計(jì)算。

在藥物發(fā)現(xiàn)方面,加拿大AI制藥創(chuàng)企Entos發(fā)明了一種深度學(xué)習(xí)架構(gòu)OrbNet,用物理機(jī)器學(xué)習(xí)方法訓(xùn)練圖神經(jīng)網(wǎng)絡(luò),取代分子模擬中昂貴的原子間作用力,將分子模擬速度提高1000倍。

08.Quantum-2:史上最先進(jìn)端到端網(wǎng)絡(luò)平臺(tái)

此次GTC期間,NVIDIA還宣布了下一代NVIDIA Quantum-2平臺(tái),可進(jìn)行云原生超級(jí)計(jì)算。

該網(wǎng)絡(luò)平臺(tái)由NVIDIA Quantum-2交換機(jī)、ConnectX-7網(wǎng)絡(luò)適配器、BlueField-3數(shù)據(jù)處理單元(DPU)和支持新架構(gòu)的所有軟件組成。ConnectX-7將于明年1月問(wèn)世。

其中,Quantum-2 InfiniBand交換機(jī)基于新的Quantum-2 ASIC,采用臺(tái)積電7N節(jié)點(diǎn),包含570個(gè)晶體管,超過(guò)有540億晶體管的A100。

Quantum-2 InfiniBand擁有400Gbps,網(wǎng)絡(luò)速度翻倍,交換機(jī)吞吐量增加了2倍,集群可擴(kuò)展性增為原來(lái)的6.5倍,同時(shí)降低了數(shù)據(jù)中心的功耗。

其多租戶性能隔離利用先進(jìn)的基于遙測(cè)的擁塞控制系統(tǒng),確??煽康耐掏铝?,無(wú)論用戶激增或工作量需求激增,都能確??煽康耐掏铝?,從而防止一個(gè)租戶的活動(dòng)干擾其他租戶的活動(dòng)。

相比上一代,第三代SHARPv3TM網(wǎng)絡(luò)計(jì)算技術(shù)的交換機(jī)計(jì)算能力比原來(lái)高32倍,用于加速AI訓(xùn)練。

09.新加速庫(kù):優(yōu)化路線規(guī)劃,加速量子模擬

最后,我們來(lái)看看NVIDIA推出的3個(gè)新加速庫(kù)。

首先是NVIDIA ReOpt,這是一款針對(duì)運(yùn)籌優(yōu)化問(wèn)題的加速求解器,可實(shí)現(xiàn)實(shí)時(shí)路線規(guī)劃優(yōu)化。

以與NVIDIA合作的達(dá)美樂(lè)披薩為例,配送14個(gè)披薩的路徑有870億種,這意味達(dá)美樂(lè)要在30分鐘內(nèi)將披薩送達(dá)絕非易事。

運(yùn)籌優(yōu)化對(duì)“最后一英里”配送是必需的,路線規(guī)劃是個(gè)極為棘手的物流問(wèn)題,如果應(yīng)用到行業(yè)中,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元。

黃仁勛展示了一個(gè)用NVIDIA Omniverse虛擬倉(cāng)庫(kù)來(lái)展示優(yōu)化路線在自動(dòng)訂單揀選場(chǎng)景中的影響,優(yōu)化后的規(guī)劃能使訂單揀選節(jié)省一半的時(shí)間和路程。

當(dāng)前路線優(yōu)化求解器收到新訂單后,需要數(shù)小時(shí)來(lái)重新運(yùn)行和響應(yīng),而ReOpt能持續(xù)運(yùn)行并實(shí)時(shí)動(dòng)態(tài)地進(jìn)行重新優(yōu)化,在短短幾秒鐘內(nèi)響應(yīng)并擴(kuò)展至數(shù)千個(gè)位置。

第二個(gè)是cuQuantum DGX設(shè)備,配備有針對(duì)量子計(jì)算工作流的加速庫(kù),可用態(tài)矢量和張量網(wǎng)絡(luò)的方法來(lái)加速量子電路模擬。

谷歌Cirq將成第一個(gè)得到加速的量子模擬器。

借助該設(shè)備,曾經(jīng)需要耗費(fèi)幾個(gè)月的模擬,現(xiàn)在幾天就能完成。

NVIDIA研究部門在量子算法模擬方面取得了重要里程碑,用1688個(gè)量子位為3375個(gè)頂點(diǎn)集求解MaxCut問(wèn)題。

這是有史以來(lái)最大的精確量子電路模擬,比以往模擬的量子位多8倍。

cuQuantum DGX設(shè)備將在第一季度推出。

第三個(gè)加速庫(kù)是在PyData和NumPy生態(tài)系統(tǒng)的大規(guī)模加速計(jì)算cuNumeric,它允許用戶用Python代碼在超級(jí)計(jì)算機(jī)上透明加速和擴(kuò)展NumPy工作流,并無(wú)需更改代碼。

它屬于NVIDIA RAPIDS開(kāi)源Python數(shù)據(jù)科學(xué)套件,RAPIDS今年的下載量超過(guò)50萬(wàn)次,比去年增長(zhǎng)了4倍多。NumPy在過(guò)去5年下載量達(dá)到了1.22億次,別用于GitHub上近80萬(wàn)個(gè)項(xiàng)目。

在著名的CFD Python教學(xué)代碼中,cuNumeric能擴(kuò)展至1000個(gè)GPU,而擴(kuò)展效率僅比線性擴(kuò)展效率損失了20%。

10.結(jié)語(yǔ)

乘著AI、高性能計(jì)算和元宇宙的東風(fēng),NVIDIA今年過(guò)得可謂風(fēng)生水起,市值一路扶搖直上,突破7700億美元。其Omniverse平臺(tái)更是被分析機(jī)構(gòu)視作NVIDIA一項(xiàng)重要的平臺(tái)擴(kuò)張戰(zhàn)略。

在這表面風(fēng)光的背后,NVIDIA的遠(yuǎn)見(jiàn)和前瞻性不容小覷。無(wú)論是如火如荼的AI,還是方興未艾的虛擬世界,NVIDIA能成為科技熱潮的直接受益者,都離不開(kāi)過(guò)去多年對(duì)其軟硬件產(chǎn)品的打磨。

此次NVIDIA GTC大會(huì)期間,我們還將看到更多覆蓋深度學(xué)習(xí)、數(shù)據(jù)科學(xué)、高性能計(jì)算、機(jī)器人等領(lǐng)域的最新進(jìn)展,而始于NVIDIA CUDA的加速計(jì)算正在這些領(lǐng)域催化效率提升,推動(dòng)現(xiàn)代科技快速進(jìn)化、走向未來(lái)。

本文來(lái)自微信公眾號(hào)“芯東西”(ID:aichip001),作者:ZeR0,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 英偉 巴掌 化身

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片