首頁>消費(fèi) >
速遞!AI大模型熱潮下算力需求爆發(fā):臨港欲建百億產(chǎn)業(yè) 商湯當(dāng)“鏈主” 2023-06-04 08:45:08  來源:澎湃新聞

2022年1月24日,商湯科技在上海自貿(mào)區(qū)臨港新片區(qū)布局的人工智能計算中心AIDC正式啟動運(yùn)營。當(dāng)時這家人工智能公司未必能精準(zhǔn)預(yù)測,2022年即成為了所謂的AIGC(AI Generated Content)元年。


(資料圖)

“今天,我們的臨港AIDC已經(jīng)有接近3萬塊的GPU(圖形處理器),我們目前的算力已經(jīng)達(dá)到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千萬億次浮點(diǎn)運(yùn)算),在這之上我們相信未來可以有更好的開發(fā)者效率,并且都能夠支持更多千億規(guī)模的大模型算力訓(xùn)練?!痹?月2日的“AI引領(lǐng)時代,算力驅(qū)動未來”——臨港新片區(qū)智算大會上,商湯科技董事長兼CEO 徐立如是表示。

據(jù)澎湃新聞記者從商湯方面了解,“目前還有大量的需求在路上排著隊”。而在商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆看來,人工智能對于更大數(shù)據(jù)、更大規(guī)模、更大算力的追求并不是“始于今天”,“整個人工智能技術(shù)迭代、進(jìn)步的歷史,我們可以把它看成是一個對于‘暴力美學(xué)’的追求,以及算法、算力、數(shù)據(jù)三要素由量變產(chǎn)生質(zhì)變的一個技術(shù)迭代的過程。”

聚焦前沿產(chǎn)業(yè)的臨港新片區(qū)對這種新的熱潮迅速做出了響應(yīng)。6月2日當(dāng)天,臨港新片區(qū)黨工委副書記吳曉華在上述大會上發(fā)布了《臨港新片區(qū)加快構(gòu)建算力產(chǎn)業(yè)生態(tài)行動方案》。該《方案》的藍(lán)圖之下,至2025年,臨港將成為具有全國影響力的算力產(chǎn)業(yè)集聚區(qū),含相關(guān)硬件、軟件、應(yīng)用、服務(wù)等的算力產(chǎn)業(yè)總體規(guī)模將突破100億元。

“我們看到AI大爆發(fā)的時代已經(jīng)來臨了,AI進(jìn)入到我們生產(chǎn)和生活的各個領(lǐng)域,那么隨著 AI應(yīng)用的大爆發(fā),它其實(shí)也驅(qū)動了算力需求的大爆發(fā)。”對于上述《方案》的出臺,臨港新片區(qū)管委會高科處處長陸瑜對澎湃新聞在內(nèi)的媒體表示,臨港前期已具備了很好的優(yōu)勢,“就是我們的算力資源非常豐富?!?/p>

更為重要的是,在人工智能公司選擇是否落地臨港時,算力資源已經(jīng)成為尤為重要的決策因素。

算力是新時代的能源,而成功又不僅僅在于“暴力美學(xué)”

何謂算力?徐立認(rèn)為,算力其實(shí)是整個模型能力的表達(dá),“算力等于算法或者說大模型的參數(shù),去乘上它所處理的數(shù)據(jù)量。大模型時代參數(shù)越大,乘上的數(shù)據(jù)量越大,所需要的算力就越大?!彼懔σ讶怀蔀樾聲r代的能源,“某種程度上,算力決定了市場的競爭力?!?/p>

楊帆也談到,從去年到今年整個人工智能領(lǐng)域非常火的一個概念叫內(nèi)容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種“暴力美學(xué)”,例如,GPT-3模型使用了超過1750億個參數(shù),需要高性能的處理器來支持訓(xùn)練,使用V100訓(xùn)練耗卡量為10000張卡訓(xùn)練14.8天,整體算力需求約625 PetaFLOPS。

楊帆認(rèn)為,這種“暴力美學(xué)”也可以理解為量變產(chǎn)生質(zhì)變,“其實(shí)人工智能從它誕生的第一天起到今天,一直都在追求通過規(guī)?;瘞砀鼜?qiáng)的智能化?!彼岬?,實(shí)際上就人工智能領(lǐng)域來說,在過去的5-6年時間里,業(yè)內(nèi)最頂級的人工智能模型對算力的消耗量,“每4-6個月就要翻一番,也就是說過去的這幾年時間里翻了近30萬倍。”

當(dāng)然,“暴力”和“智能”并不是完全成正比,“擁有更大的資源、更大的規(guī)模,它僅僅是一個必要而非充分的條件?!睏罘珡?qiáng)調(diào),真正在“暴力美學(xué)”背后支撐產(chǎn)生重大的技術(shù)創(chuàng)新和成果的,恰恰又是在于對每一個環(huán)節(jié)的持續(xù)性的優(yōu)化和改進(jìn)。

以數(shù)據(jù)為例,“GPT-4所用的數(shù)據(jù)其實(shí)只是OpenAI收集到的所有數(shù)據(jù)的1%,因為他發(fā)現(xiàn)當(dāng)把更多的數(shù)據(jù)去灌給機(jī)器人的時候,有可能反而不那么聰明,應(yīng)該把更加有效、更加高價值的數(shù)據(jù)提供給這個算法,然后才能去創(chuàng)造出一個更加聰明的大腦?!?/p>

其認(rèn)為,至少在今天,數(shù)據(jù)的有效性遠(yuǎn)比數(shù)據(jù)的總量更加重要。而如何定義有效的數(shù)據(jù),“這其實(shí)就需要數(shù)據(jù)科學(xué)家大量的努力,OpenAI其實(shí)讓他們最優(yōu)秀的科學(xué)家去做數(shù)據(jù)了,并非大家覺得的去搞算法了?!?/p>

這種每個環(huán)節(jié)的優(yōu)化同樣包括算力,在英偉達(dá)缺貨的情況下,為什么沒人在用國產(chǎn)芯片做商業(yè)化的大規(guī)模訓(xùn)練?為什么最新這波浪潮到來后,第一時間錢都被英偉達(dá)掙走了?這些問句背后的解釋是,“并不是我們把算力量堆到一個數(shù)值就能夠產(chǎn)生最終的價值,1000張卡100臺服務(wù)器放在一起跑同一個任務(wù),這中間還需要大量的配套軟件、通信網(wǎng)絡(luò),它是一系列軟硬件聯(lián)合調(diào)優(yōu)的過程,這樣的工作積累我們過去沒有做,我們今天就需要去補(bǔ)課?!?/p>

順勢而為,臨港加快形成多元算力供給體系

據(jù)吳曉華介紹,臨港新片區(qū)算力產(chǎn)業(yè)已在上游軟硬件、中游的數(shù)據(jù)中心、調(diào)度平臺,下游應(yīng)用進(jìn)行了相應(yīng)布局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等于每秒1百億億次浮點(diǎn)運(yùn)算),其中智能算力占比近80%,總算力規(guī)模約占上海市近20%。

前述《方案》提出,目標(biāo)到2025年,新片區(qū)將形成以智算算力為主、基礎(chǔ)算力和超算算力協(xié)同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力占比達(dá)到80%,算力產(chǎn)業(yè)總體規(guī)模(含相關(guān)硬件、軟件、應(yīng)用、服務(wù)等)突破100億元,建成公共算力服務(wù)平臺,規(guī)范算力交易機(jī)制,實(shí)現(xiàn)區(qū)域算力調(diào)度,打造具有全國影響力的算力產(chǎn)業(yè)集聚區(qū),建設(shè)一批算力示范應(yīng)用標(biāo)桿場景。

“智能算力也就是當(dāng)下最為火熱的AI企業(yè)所需要的,我們也發(fā)現(xiàn),AI企業(yè)落地到臨港來,他們不再是僅僅關(guān)注給他他多少政策支持,給他多少補(bǔ)貼,他會關(guān)注落地在這邊,能不能解決他的算力需求,因為現(xiàn)在市場上算力是非常緊缺的?!标戣ぬ岬搅诉@一顯著變化。

據(jù)商湯方面介紹,截至今年5月,商湯大裝置已累計服務(wù)超40個核心客戶?!疤貏e是在大模型的浪潮之下,我們現(xiàn)在支撐了10家以上的單位機(jī)構(gòu)在臨港的智能計算中心中去訓(xùn)練他們的大模型?!睏罘蔡峒?。

成立于2018年的深勢科技是算力需求方之一。該公司核心團(tuán)隊由中國科學(xué)院院士鄂維南等人領(lǐng)銜,是“AI+Science”科學(xué)研究范式的先行者,其首創(chuàng)的“多尺度建模+機(jī)器學(xué)習(xí)+高性能計算”范式,突破性地實(shí)現(xiàn)了多尺度分子模擬中精度與效率的統(tǒng)一。

據(jù)澎湃新聞記者此前報道,深勢科技已推出Lebesgue科學(xué)計算平臺、Hermite藥物設(shè)計平臺以及Bohrium微觀計算與設(shè)計平臺等。例如在醫(yī)藥領(lǐng)域,深勢科技與多家客戶攜手,將物理建模+AI的計算范式與臨床前藥物研發(fā)更廣泛的結(jié)合,通過Hermite Uni-FEP、Uni-Fold、RiD等模塊,將自由能微擾理論、分子動力學(xué)、增強(qiáng)采樣算法與高性能計算相結(jié)合,精準(zhǔn)預(yù)測蛋白質(zhì)結(jié)構(gòu)及構(gòu)象變化,并以化學(xué)精度高效評估蛋白與配體的結(jié)合自由能,為藥物研發(fā)人員提供高效精準(zhǔn)的理論指導(dǎo),提升藥物設(shè)計與優(yōu)化效率。

去年12月29日,總部位于北京的深勢科技在臨港注冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務(wù)副總裁劉會師在接受澎湃新聞記者采訪時表示,公司在臨港布局新一代分子模擬算法研發(fā)中心和AI輔助藥物設(shè)計業(yè)務(wù)中心,主要也是因為看到臨港正在大力發(fā)展算力,“我們在訓(xùn)練模型過程中,對算力是有需求的,另外臨港尤其是要大力發(fā)展國產(chǎn)化算力,我們也想為這方面添磚加瓦?!?/p>

從業(yè)務(wù)層面來說,“我們在臨港主要是布局我們的藥物研發(fā)業(yè)務(wù),包括我們自有管線的研發(fā)?!眲熖岬?,深勢科技的業(yè)務(wù)和臨港甚至上海的人工智能、生物醫(yī)藥這樣的先導(dǎo)產(chǎn)業(yè)有正相關(guān)的直接合作關(guān)系,“我們愿意把我們的研發(fā)以及產(chǎn)品納入到臨港的大的生態(tài)圈里來。”

上述《方案》同時提及,臨港新片區(qū)也制定了一系列保障措施,包括加強(qiáng)人才保障、完善支持政策、推動開放合作等。據(jù)陸瑜介紹,如果AI企業(yè)到臨港來,將優(yōu)先提供臨港的智能算力,同時通過發(fā)放算力券等形式,讓企業(yè)優(yōu)惠使用算力,“甚至對重點(diǎn)的AI企業(yè),政府對它的算力成本直接可以給予不超過30%的補(bǔ)貼,這些政策我們都會出來?!?/p>

值得關(guān)注的是,在此次大會現(xiàn)場,中國電信臨港公共智算服務(wù)平臺暨國產(chǎn)GPU聯(lián)合創(chuàng)新基地也正式發(fā)布。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區(qū)建設(shè),并將分批次投放4萬個適用于智算、超算的高功率機(jī)架。

上海市經(jīng)濟(jì)和信息化委員會副主任湯文侃當(dāng)天表示,當(dāng)前,以“網(wǎng)絡(luò)為基礎(chǔ)、數(shù)據(jù)為核心、算力為關(guān)鍵、安全為底線”的新一代信息基礎(chǔ)設(shè)施已成為建設(shè)現(xiàn)代化產(chǎn)業(yè)的重要基礎(chǔ)支撐。上海已提出構(gòu)建“2+(3+6)+(4+5)”的現(xiàn)代化產(chǎn)業(yè)架構(gòu),這對以算力為代表的新型信息基礎(chǔ)設(shè)施建設(shè)提出了更高需求。

而就在5月16日,上海市經(jīng)濟(jì)和信息化委員會公布了通過 《上海市數(shù)據(jù)中心建設(shè)導(dǎo)則》符合性評估的數(shù)據(jù)中心項目名單,共支持了16個項目,其中位于臨港的項目有2個?!敖刂聊壳?,我委共支持新片區(qū)包括,商湯AIDC、有孚網(wǎng)絡(luò)、信息飛魚等8個項目,合計2.8萬個6kW標(biāo)準(zhǔn)機(jī)柜,占全市已批機(jī)柜數(shù)量近1/5?!?/p>

湯文侃同時提出建議之一,即利用臨港充沛算力資源構(gòu)建公共算力服務(wù)?!澳壳埃R港的商湯AIDC已經(jīng)接入了公共算力服務(wù)平臺。在此也希望今天參會的各單位,特別是電信運(yùn)營商,結(jié)合臨港的網(wǎng)絡(luò)特點(diǎn),積極在臨港建設(shè)極速算力承載網(wǎng),助力實(shí)現(xiàn)網(wǎng)絡(luò)無所不達(dá)、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務(wù)?!?/p>

成立智算產(chǎn)業(yè)聯(lián)盟,商湯當(dāng)產(chǎn)業(yè)鏈鏈主

基于現(xiàn)有優(yōu)勢及未來需求,臨港希望構(gòu)建的是一個上中下游一體化的算力產(chǎn)業(yè)聯(lián)盟,進(jìn)行協(xié)同式、體系化發(fā)展。

陸瑜將臨港的算力供給視作整條產(chǎn)業(yè)鏈的“中間一段”,一端為落地到臨港的AI企業(yè)提供算力保障,另一端則涉及到對算力來說極為關(guān)鍵的“芯片、軟件、系統(tǒng)”,“我們希望有了需求端,也有了這樣一個平臺端,那么我們把計算的芯片企業(yè)、軟件企業(yè)、系統(tǒng)企業(yè)集聚在這里,讓他們深度地參與到這樣一個系統(tǒng)的建設(shè)過程當(dāng)中?!?/p>

楊帆也強(qiáng)調(diào),“今天看到的大模型所有的成績的發(fā)展,它既是暴力出奇跡,通過人工智能三要素的持續(xù)規(guī)模上升帶來的技術(shù)價值的提升,同時也是基礎(chǔ)的研發(fā)能力和系統(tǒng)的工程化能力之間的深度結(jié)合,算法優(yōu)化、數(shù)據(jù)的整理和選取、平臺性算力的優(yōu)化提供,這三者往往是互相連通的,很難把它變成割裂的環(huán)節(jié)獨(dú)自去做?!?/p>

他表示,智能算力產(chǎn)業(yè)鏈的重要價值在于,“只有鏈上有更多的企業(yè),大家去促進(jìn)彼此的交流思考,更深度地去進(jìn)行一些合作,才能夠在這樣新的關(guān)鍵性的重大技術(shù)浪潮中,去做到更好的技術(shù)進(jìn)步和支持?!?/p>

大會現(xiàn)場,新片區(qū)智算產(chǎn)業(yè)聯(lián)盟也正式成立,聯(lián)通作為聯(lián)盟首任輪值理事長單位。據(jù)悉,未來聯(lián)通將在新片區(qū)成立長三角創(chuàng)新研究院,進(jìn)一步助力新片區(qū)智算產(chǎn)業(yè)發(fā)展。

新片區(qū)智算產(chǎn)業(yè)聯(lián)盟成員代表由智算算力、基礎(chǔ)算力和超算算力中心等算力提供企業(yè),GPU、FPGA、ASIC等算力芯片企業(yè),以及大模型、AI for science等算力需求企業(yè),共計25家企業(yè),以及中國信通院華東分院、西安電子科技大學(xué)、電子科技大學(xué)共計3所高校與科研院所共同組成,后續(xù)將開展資源共享、技術(shù)交流和項目合作。商湯科技則被授予“新片區(qū)智算產(chǎn)業(yè)鏈鏈主”。

GPU芯片廠商沐曦當(dāng)天即表示,分別滿足AI推理計算、AI訓(xùn)練/通用計算、高性能渲染功能的三類GPU產(chǎn)品,應(yīng)用于AI推理、AI訓(xùn)練、數(shù)據(jù)中心、元宇宙、云游戲等領(lǐng)域,將賦能各領(lǐng)域轉(zhuǎn)型發(fā)展。

湯文侃也對臨港新片區(qū)此次智算產(chǎn)業(yè)聯(lián)盟的成立寄予厚望,“依托商湯科技這樣的鏈主企業(yè),結(jié)合自身優(yōu)勢,探索產(chǎn)業(yè)鏈上下游全要素協(xié)同,形成數(shù)字經(jīng)濟(jì)新的爆發(fā)點(diǎn)?!?/p>

在當(dāng)天的大會現(xiàn)場,有12家企業(yè)共同簽署了新片區(qū)智算產(chǎn)業(yè)上下游企業(yè)協(xié)同采購協(xié)議。陸瑜提到,新片區(qū)也將出臺協(xié)同采購正面清單,“如果企業(yè)在建設(shè)國產(chǎn)化算力平臺的過程當(dāng)中,購買國產(chǎn)GPU等上游產(chǎn)品,我們就會給予補(bǔ)貼,這樣也是鼓勵上下游企業(yè)去更好地合作。”

(文章來源:澎湃新聞)

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片