首頁(yè)>消費(fèi) >
“大模型至少有10年紅利期”!周鴻祎最新發(fā)聲 世界時(shí)訊 2023-06-14 09:55:36  來(lái)源:中國(guó)基金報(bào)

在發(fā)布智腦視覺(jué)大模型不到半個(gè)月后,三六零(601360)又在6月13日,發(fā)布其智腦大模型4.0版本,其特點(diǎn)是多模態(tài)、全端應(yīng)用、數(shù)字人。

在發(fā)布會(huì)現(xiàn)場(chǎng),三六零董事長(zhǎng)周鴻祎認(rèn)為,大模型至少有10年紅利期;對(duì)個(gè)人和企業(yè)來(lái)說(shuō),數(shù)字人是未來(lái)人工智能大模型最合適的入口。


(資料圖片)

在周鴻祎看來(lái),大模型的安全問(wèn)題超越了內(nèi)容安全,應(yīng)該訓(xùn)練另一個(gè)GPT來(lái)監(jiān)督GPT;未來(lái)如果只講發(fā)展不講安全,該大模型會(huì)走不遠(yuǎn)。據(jù)其透露,360已啟動(dòng)了安全團(tuán)隊(duì)在人工智能安全上的研究,首創(chuàng)了一個(gè)大模型安全風(fēng)險(xiǎn)的評(píng)估體系A(chǔ)ISE,下一步將會(huì)公布。

6月13日上午,三六零股價(jià)大漲超9%,但午后逐漸回落,最終以5.49%的漲幅收盤(pán),目前市值為1099億。

已趕上國(guó)際平均水平

大模型至少有10年紅利期

在發(fā)布會(huì)現(xiàn)場(chǎng),與會(huì)者普遍感覺(jué)到,周鴻祎明顯變瘦了。

對(duì)于國(guó)內(nèi)大模型的發(fā)展水平,周鴻祎表示,“國(guó)內(nèi)現(xiàn)在(AI大模型)你追我趕,不斷相互激勵(lì),縮小和全球領(lǐng)先技術(shù)的距離。原來(lái)我說(shuō)(差距)有一年半、兩年,我今天收回這句話。我認(rèn)為國(guó)內(nèi)現(xiàn)在這種發(fā)展迭代速度,已經(jīng)基本趕上或者接近國(guó)際平均水平?!?/p>

對(duì)于如何做大模型,周鴻祎認(rèn)為,現(xiàn)在不應(yīng)該只是拘泥于做很多通用的基礎(chǔ)能力,而應(yīng)該想一想,如何把大模型做成真正像電一樣,能夠輸送到百行千業(yè)、千家萬(wàn)戶、千千萬(wàn)萬(wàn)企業(yè),輸送到億萬(wàn)個(gè)辦公一族身邊,這樣才能產(chǎn)生工業(yè)級(jí)革命的力量。

“大模型就像發(fā)電場(chǎng)一樣,通過(guò)訓(xùn)練大數(shù)據(jù),直接產(chǎn)生了電力,可以把通用的人工智能能力直接輸送給每個(gè)行業(yè)和企業(yè),把石油加工成電,這就產(chǎn)生了未來(lái)5-10年新的工業(yè)革命的機(jī)會(huì)?!?/p>

在周鴻祎看來(lái),今天大模型的價(jià)值,不僅僅在于ChatGPT的使用量,以及一些互聯(lián)網(wǎng)場(chǎng)景的結(jié)合,更在于未來(lái)把大模型這種人工智能的能力垂直化、產(chǎn)業(yè)化、企業(yè)化、個(gè)人化,“這樣的產(chǎn)業(yè)機(jī)會(huì)剛剛開(kāi)始,未來(lái)至少有10年的紅利期”。

據(jù)其介紹,谷歌發(fā)布的大模型策略中,有四種大小尺寸不一樣的大模型。

Facebook發(fā)布的以“LLaMA羊駝”為首的開(kāi)源大模型里面,有一種方式是把大模型越做越大,參數(shù)越大,訓(xùn)練的語(yǔ)料越大。

但還有一種方式,是把大模型做小,即把它用在垂直領(lǐng)域,讓甚至可以安裝在一臺(tái)電腦或者手機(jī)上。如果能裝在手機(jī)上,就意味著大模型將來(lái)可以部署在邊緣技術(shù)設(shè)備,甚至部署在IoT設(shè)備上。

因此,在“做大”的同時(shí),大模型還有一個(gè)“做小”的方向。

“應(yīng)該自己抽自己幾耳光”

在周鴻祎看來(lái),大模型的難度已經(jīng)不在于模型,模型有很多選擇,算法基本上都是公開(kāi)的。

“今天的挑戰(zhàn)在于,用什么樣的數(shù)據(jù)做預(yù)訓(xùn)練,用什么樣的題海戰(zhàn)術(shù)做有監(jiān)督的微調(diào)。最后還有一個(gè)很重要的,就是這模型必須要在互聯(lián)網(wǎng)上找到用戶使用,因?yàn)橛脩舻氖褂盟氲搅烁鞣N例子,遠(yuǎn)遠(yuǎn)超越我們自己內(nèi)部的測(cè)試。”

因此,周鴻祎認(rèn)為,今天訓(xùn)練大模型應(yīng)該說(shuō)不難,其壁壘在于數(shù)據(jù)、用戶標(biāo)注、答題的標(biāo)注,以及用戶的使用反饋。

談到此處時(shí),周鴻祎突然表示了深刻的反省:

“當(dāng)然說(shuō)起來(lái)也很慚愧,講這一頁(yè)的時(shí)候,我覺(jué)得我們做搜索的公司都應(yīng)該自己抽自己幾耳光?!?/p>

實(shí)際上,搜索公司都在發(fā)展大模型技術(shù),無(wú)論是Bing、百度,還是谷歌。2018年,谷歌發(fā)布了BERT算法,360當(dāng)時(shí)就進(jìn)行了跟蹤和使用,后來(lái)包括T5和GPT這幾個(gè)版本,360也進(jìn)行了研究和跟進(jìn)。

我們確實(shí)缺乏OpenAI的這種精神,他們這些人對(duì)通用人工智能有一種執(zhí)念,他們夢(mèng)想把人類(lèi)所有的知識(shí)訓(xùn)到一個(gè)大模型里面,而且堅(jiān)定地走只有解碼器的路線。

其他的公司雖然也都用大模型,我們就比較雞賊地用大模型解決很多現(xiàn)實(shí)的問(wèn)題,比如廣告點(diǎn)擊率高一點(diǎn),推薦的內(nèi)容好看一點(diǎn),給你推薦的視頻讓你欲罷不能,大家都忙著做跟現(xiàn)實(shí)場(chǎng)景的結(jié)合。

用GPT監(jiān)督GPT

人工智能是一把雙刃劍,大模型本身也會(huì)有漏洞,會(huì)被人利用。

業(yè)內(nèi)普遍認(rèn)為,發(fā)展大模型的三大要素是算力、算法、數(shù)據(jù),但周鴻祎認(rèn)為應(yīng)該改成算力、數(shù)據(jù)和訓(xùn)練,而且還應(yīng)加上“安全”。

“不管在哪一個(gè)國(guó)家做大模型和生成式AI,都要保證輸出的內(nèi)容不能違背當(dāng)?shù)氐姆煞ㄒ?guī),要符合當(dāng)?shù)氐牡赖铝?xí)俗。原來(lái)我認(rèn)為這是Mission Impossible(不可能完成的任務(wù)),但在工程人員的研究下,我們找到了一個(gè)突破。怎么保證GPT不說(shuō)錯(cuò)話?答案是訓(xùn)練另外一個(gè)GPT來(lái)監(jiān)督這個(gè)GPT?!敝茗櫟t表示。

在周鴻祎看來(lái),大模型的安全問(wèn)題超越了內(nèi)容安全,還有更多內(nèi)涵。

“大模型可以讓一個(gè)小白變成專(zhuān)家,也能讓一個(gè)很低水平的、原來(lái)當(dāng)不了黑客的人,變成能寫(xiě)攻擊代碼、釣魚(yú)郵件、研究系統(tǒng)漏洞的壞家伙,使得干壞事的成本降低了很多?!?/p>

據(jù)其透露,360已經(jīng)啟動(dòng)了安全團(tuán)隊(duì)在人工智能安全上的研究,首創(chuàng)了一個(gè)大模型安全風(fēng)險(xiǎn)的評(píng)估體系A(chǔ)ISE,下一步將會(huì)公布。

而在6月10日的北京智源大會(huì)上,OpenAI聯(lián)合創(chuàng)始人、CEO薩姆·奧特曼(Sam Altman)當(dāng)時(shí)在演講中表示,“AI安全是最新的技術(shù),需要思考關(guān)鍵的AI安全問(wèn)題,需要構(gòu)建安全的分類(lèi)器和檢測(cè)器,以監(jiān)測(cè)符合用戶政策的情況,這一點(diǎn)很重要。”

薩姆·奧特曼當(dāng)時(shí)稱(chēng),應(yīng)該推動(dòng)并引導(dǎo)與安全研究一致的投資。他當(dāng)時(shí)表示,正在投資幾個(gè)新的且有望能取得成果的方向,其中之一是可擴(kuò)展的監(jiān)督,嘗試使用AI系統(tǒng)來(lái)協(xié)助人類(lèi)監(jiān)督其他AI系統(tǒng)。

“未來(lái)如果只講發(fā)展不講安全,這個(gè)大模型是走不遠(yuǎn)的。我們把安全能力和大模型的研發(fā)結(jié)合起來(lái),一方面用安全加強(qiáng)大模型的能力,另外一方面用安全使大模型更加可控?!敝茗櫟t強(qiáng)調(diào)。

對(duì)此,一位業(yè)內(nèi)資深人士對(duì)記者表示,這個(gè)方向是對(duì)的,因?yàn)槿斯ぶ悄艿哪芰σ话闳吮O(jiān)管不過(guò)來(lái),一定是以其人之道還治其人之身,訓(xùn)練一個(gè)能夠監(jiān)管人工智能的人工智能,或者用智能更高的人工智能監(jiān)管智能水平低的人工智能,如用GPT5來(lái)監(jiān)管GPT4。                

大模型又迎發(fā)布潮

聚焦應(yīng)用產(chǎn)品大規(guī)模升級(jí)上線

2023年4月,中國(guó)移動(dòng)研究院發(fā)布了《我國(guó)人工智能大模型發(fā)展動(dòng)態(tài)》。報(bào)告顯示,國(guó)內(nèi)大模型整體與GPT3.0性能相當(dāng),百度、騰訊、阿里、華為等處于第一梯隊(duì)。

從大模型的布局體系來(lái)看,科技大廠在算力層、平臺(tái)層、模型層、應(yīng)用層進(jìn)行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應(yīng)用進(jìn)行自主研發(fā)的全面布局,如百度的“昆侖芯+飛槳平臺(tái)+文心大模型+行業(yè)應(yīng)用”、阿里的“含光800芯片+M6-OFA 底座+通義大模型+行業(yè)應(yīng)用”、華為的“昇騰芯片+MindSpore 框架+盤(pán)古大模型+行業(yè)應(yīng)用”。

從大模型參數(shù)量看,科技大廠的參數(shù)量遠(yuǎn)大于科研院所。

2023年5月,科技部直屬的中國(guó)科技信息研究所在中關(guān)村論壇發(fā)布《中國(guó)人工智能大模型地圖研究報(bào)告》。

據(jù)該報(bào)告不完全統(tǒng)計(jì),截至目前,參數(shù)在10億規(guī)模以上的大模型全國(guó)已發(fā)布了79個(gè)。其中,科技大廠的大模型參數(shù)量較大:阿里通義千問(wèn)大模型參數(shù)在10萬(wàn)億級(jí)以上、騰訊混元大模型和華為盤(pán)古大模型參數(shù)量均在萬(wàn)億級(jí)以上、百度文心一言大模型參數(shù)量在2千億級(jí)以上、京東言犀大模型的參數(shù)量為千億級(jí);垂直行業(yè)科技企業(yè)已經(jīng)上線的參數(shù)量普遍在千億級(jí)以上;而科研院校大模型的參數(shù)量在千億級(jí)及以下。

民生證券研究院計(jì)算機(jī)團(tuán)隊(duì)認(rèn)為,在經(jīng)歷二月至三月的大模型集中發(fā)布期、四月至五月的產(chǎn)品研發(fā)期和政策方向逐步明確后,六月起,人工智能大模型產(chǎn)品和應(yīng)用有望迎來(lái)集中發(fā)布。

但是,不同于二三月份的純粹大模型發(fā)布,新一輪發(fā)布潮,是基于大模型的應(yīng)用產(chǎn)品開(kāi)始大規(guī)模升級(jí)上線,為走進(jìn)千家萬(wàn)戶做準(zhǔn)備。

從相關(guān)企業(yè)的情況來(lái)看,在科大訊飛、三六零之后,6月16日,華為人工智能框架生態(tài)峰會(huì)也將在上海召開(kāi),舉辦“上海昇思AI框架&大模型創(chuàng)新中心啟動(dòng)暨伙伴入駐儀式”,以共建AI開(kāi)源生態(tài)。

(文章來(lái)源:中國(guó)基金報(bào))

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片