首頁(yè)>資訊 >
全球速看:基于獨(dú)創(chuàng)的“數(shù)據(jù)克隆”技術(shù),南棲仙策專(zhuān)注通用智能決策 2023-03-15 06:01:23  來(lái)源:36氪

人工智能正在迎來(lái)新一輪的熱潮。自ChatGPT上線以來(lái),自然語(yǔ)言處理的發(fā)展?jié)摿χ饾u被認(rèn)可,人們開(kāi)始相信人工智能具有像人類(lèi)一樣智能的可能性,通往通用人工智能(AGI)的路程又近了一步。然而,深度學(xué)習(xí)泰斗、圖靈獎(jiǎng)得主Yan LeCun認(rèn)為,ChatGPT并不能做規(guī)劃決策,因此還沒(méi)有“真正的智能”,并認(rèn)為通往“真正智能”的關(guān)鍵環(huán)節(jié)是“世界建?!?。有了世界模型,就可以在其中求解最優(yōu)決策。因此,在ChatGPT實(shí)現(xiàn)通用語(yǔ)言智能之后,進(jìn)一步值得關(guān)注的人工智能領(lǐng)域是通用智能決策。

南棲仙策是一家專(zhuān)注研究通用智能決策的公司,由南京大學(xué)人工智能創(chuàng)新研究院技術(shù)孵化,自2019年起,基于自主探索的強(qiáng)化學(xué)習(xí)、環(huán)境模擬、策略遷移、深度學(xué)習(xí)等技術(shù),推動(dòng)智能決策在現(xiàn)實(shí)場(chǎng)景落地。


(資料圖片)

在人工智能領(lǐng)域,視覺(jué)技術(shù)和自然語(yǔ)言處理技術(shù)都有了較大進(jìn)展,但自AlphaGo在圍棋上戰(zhàn)勝人類(lèi)后,決策領(lǐng)域人工智能的發(fā)展一直相對(duì)緩慢。在決策領(lǐng)域,落地的關(guān)鍵并不是決策本身,而是對(duì)任務(wù)的建模,即LeCun提到的“世界模型”,如圍棋世界就有著一套游戲規(guī)則,然而,現(xiàn)實(shí)世界很難找到直接的規(guī)則和模型。

這背后還有困擾工業(yè)場(chǎng)景的一個(gè)大問(wèn)題——場(chǎng)景復(fù)雜、數(shù)據(jù)少、數(shù)據(jù)不全。工廠數(shù)字化是近幾年的產(chǎn)物,工業(yè)環(huán)境大多非常復(fù)雜,通過(guò)專(zhuān)家經(jīng)驗(yàn)很難準(zhǔn)確還原出真實(shí)環(huán)境模型,因此無(wú)法通過(guò)AI來(lái)真正實(shí)現(xiàn)決策控制,并且工業(yè)里的大量生產(chǎn)數(shù)據(jù)、歷史數(shù)據(jù)都是缺失的,這會(huì)影響人工智能算法訓(xùn)練所需的數(shù)據(jù)效果——有限的數(shù)據(jù)類(lèi)型和范圍會(huì)影響信息處理能力,而數(shù)據(jù)量少則會(huì)限制人工智能算法的可演化空間。

南棲仙策研究了一種“數(shù)據(jù)克隆”的科技,可以實(shí)現(xiàn)從歷史數(shù)據(jù)完成環(huán)境建模的過(guò)程,它可以從有限的數(shù)據(jù)尋找出其底層的技術(shù)原理,再克隆出更多的數(shù)據(jù),幫助對(duì)決策引擎的訓(xùn)練,通過(guò)在虛擬世界中推演億萬(wàn)種結(jié)果,找到通向未來(lái)的最優(yōu)決策,突破人類(lèi)“有限理性”的局限,即只能基于有限信息推演出有限的決策方案。

當(dāng)行業(yè)內(nèi)公司大都選擇做無(wú)模型訓(xùn)練的時(shí)候,南棲仙策選擇了一種基于“世界模型”的強(qiáng)化學(xué)習(xí)路線。南棲仙策創(chuàng)始人兼CEO俞揚(yáng)告訴36氪,ChatGPT通過(guò)增加人工反饋的環(huán)節(jié),幫助模型學(xué)會(huì)對(duì)人價(jià)值觀的總結(jié),形成打分函數(shù),再通過(guò)最大化得分自動(dòng)調(diào)整模型,使其符合人類(lèi)的價(jià)值觀;與此相通的是,南棲仙策基于歷史數(shù)據(jù)抽象出系統(tǒng)背后的原理,形成打分函數(shù),再通過(guò)最大化得分自動(dòng)生成大量符合原理的數(shù)據(jù),從而完成精確的建模。

當(dāng)被問(wèn)到?jīng)Q策引擎精準(zhǔn)性時(shí),俞揚(yáng)表示,基于“數(shù)據(jù)克隆”的技術(shù),我們通過(guò)已收集數(shù)據(jù)生成更長(zhǎng)時(shí)間維度的數(shù)據(jù),以此保證結(jié)果的相對(duì)精準(zhǔn)性。而對(duì)于尚未收集到的數(shù)據(jù),如工廠高溫爆炸等極端情況下的數(shù)據(jù),則可以通過(guò)設(shè)置安全操作邊界等方式保障模型的安全性。

而這套技術(shù)也經(jīng)過(guò)了產(chǎn)業(yè)持續(xù)迭代過(guò)程中的工程積累。早在2017年,俞揚(yáng)就通過(guò)該技術(shù)服務(wù)了淘寶搜索團(tuán)隊(duì),幫助其實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動(dòng)環(huán)境虛擬化和零試錯(cuò)強(qiáng)化學(xué)習(xí)算法;2018年,該技術(shù)和滴滴出行合作,驗(yàn)證了算法的通用性;在多年的產(chǎn)業(yè)迭代中,逐漸發(fā)現(xiàn)了融合因果反事實(shí)推斷等原理、提出環(huán)境模型因果建模等方法,核心技術(shù)完成了數(shù)十次的迭代升級(jí)。

這套通用AI決策能基于少量數(shù)據(jù)和主動(dòng)學(xué)習(xí),滿(mǎn)足不同復(fù)雜度業(yè)務(wù)的需求;可以對(duì)億萬(wàn)種結(jié)果自主推演,獲取最大效用策略, 進(jìn)而提供現(xiàn)實(shí)世界自主決策;此外,落地時(shí)以低代碼設(shè)計(jì)形式存在,上手容易。

目前,南棲仙策提供的是一個(gè)軟硬件一體化的解決方案,「仙啟REVIVE」是南棲仙策基于數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí)開(kāi)發(fā)的智能決策軟件,通過(guò)導(dǎo)入歷史數(shù)據(jù),轉(zhuǎn)化為強(qiáng)大的決策引擎,能夠?qū)?fù)雜的決策過(guò)程梳理成可操作的業(yè)務(wù)流程,通過(guò)頂尖算法構(gòu)建“世界模型”,幫助實(shí)現(xiàn)通用性場(chǎng)景環(huán)境模型構(gòu)建及智能決策;硬件層面,南棲仙策的智能控制器已實(shí)現(xiàn)了和市面上常見(jiàn)裝備接口的連接,可以直接采集工廠已有數(shù)據(jù),也可通過(guò)安裝傳感器的方式,在不改變企業(yè)現(xiàn)有控制系統(tǒng)或單元基礎(chǔ)上實(shí)現(xiàn)不停產(chǎn)智能化改造升級(jí)。

基于環(huán)境虛擬的強(qiáng)化學(xué)習(xí)

在產(chǎn)品研發(fā)過(guò)程中,南棲仙策可以構(gòu)建動(dòng)態(tài)虛擬環(huán)境,減少企業(yè)試驗(yàn)設(shè)計(jì)中的迭代次數(shù),加快研發(fā)過(guò)程;在水務(wù)場(chǎng)景,南棲仙策通過(guò)強(qiáng)化學(xué)習(xí)的方式優(yōu)化了泵組壓力控制,能實(shí)現(xiàn)水廠泵房泵組的整體效用最大化,降低資源損耗超過(guò)10%;在資源配置場(chǎng)景,南棲仙策通過(guò)「仙啟」系統(tǒng)學(xué)習(xí)得到的配置策略,是候選技術(shù)中唯一超越人工配置的方案。

公司產(chǎn)品已進(jìn)入成熟階段,且對(duì)焦了發(fā)力的主要場(chǎng)景——智慧城市的基礎(chǔ)設(shè)施,如水務(wù)、電網(wǎng)等場(chǎng)景,并在汽車(chē)底盤(pán)控制、藥物動(dòng)力學(xué)等場(chǎng)景孕育新的應(yīng)用。其場(chǎng)景選擇的邏輯,一是尋找可復(fù)制、具有商業(yè)價(jià)值的場(chǎng)景;二是公司技術(shù)在該領(lǐng)域有著更好的解決效果。

由于驗(yàn)證周期短,智慧水務(wù)是南棲仙策當(dāng)下的主力場(chǎng)景,2023年,公司會(huì)朝著智慧電網(wǎng)、智慧工廠等場(chǎng)景拓展。以電網(wǎng)場(chǎng)景為例,隨著新能源加入,電網(wǎng)和電廠會(huì)有較大的波動(dòng),南棲仙策的產(chǎn)品可以幫助電網(wǎng)調(diào)度做更多智能決策。

在創(chuàng)始團(tuán)隊(duì)上,公司創(chuàng)始人兼CEO俞揚(yáng)是南京大學(xué)人工智能學(xué)院的教授,目前,南棲仙策共有七十多名員工,研發(fā)占比70%。在自主研發(fā)能力方面,南棲仙策的研究成果已發(fā)表在NeurIPS、ICLR等人工智能?chē)?guó)際頂級(jí)會(huì)議,公司擁有40余項(xiàng)知識(shí)產(chǎn)權(quán)。公司在2023年會(huì)加大銷(xiāo)售團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)的拓展。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片