首頁>財(cái)經(jīng) >
持續(xù)突破技術(shù)難點(diǎn),科大訊飛用技術(shù)說話傳遞冬奧溫度 2022-02-23 16:39:05  來源:榕城網(wǎng)

賽事成績多語種呈現(xiàn),人們跨越語言溝通障礙順暢交流,視障人士可以“聽見”文字,聽障人士可以“看見”文字……在剛剛閉幕的北京2022年冬奧會(huì)上,作為官方自動(dòng)語音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商的科大訊飛,提供了自動(dòng)翻譯和相關(guān)的語音轉(zhuǎn)換、語音識(shí)別及語音合成等硬核技術(shù),助力實(shí)現(xiàn)賽場(chǎng)內(nèi)外的溝通交流無障礙,一個(gè)溝通無障礙奧運(yùn)會(huì)如約呈現(xiàn)。

北京冬奧會(huì)與科大訊飛可謂是“一拍即合”,前者匯聚世界不同國家、不同語言的人群,后者具有面向冬奧場(chǎng)景的多語音、多語言處理關(guān)鍵技術(shù)。早在2019年,科大訊飛就組建了北京2022年冬奧會(huì)和冬殘奧會(huì)示范應(yīng)用專項(xiàng)團(tuán)隊(duì),借助先進(jìn)的機(jī)器翻譯和多語言語音轉(zhuǎn)換技術(shù),圍繞“人和人之間溝通無障礙、人和組織之間溝通無障礙、人和賽事之間溝通無障礙”三大方向,加速應(yīng)用場(chǎng)景落地。

基于智能語音新一代人工智能開放創(chuàng)新平臺(tái),科大訊飛研發(fā)定制了具有冬奧特征的多語種語音及語言服務(wù)平臺(tái),可提供面向冬奧場(chǎng)景定制優(yōu)化的語音識(shí)別、語音合成、機(jī)器翻譯、自動(dòng)問答等多種核心能力。達(dá)成60個(gè)語種語音合成,69個(gè)語種語音識(shí)別,168個(gè)語種機(jī)器翻譯和3個(gè)語種的交互理解,覆蓋面超過全球超200個(gè)國家和地區(qū),同時(shí)還能識(shí)別內(nèi)容進(jìn)行文本書面化處理。而機(jī)器領(lǐng)域的突破,可支持168種語言的機(jī)器翻譯;自動(dòng)問答的多

語種信息獲取及交互技術(shù),可支持中、英、日等3種語言的交互理解。

語言是一門藝術(shù)、一種智慧,也是促進(jìn)世界相知相融的重要工具。北京2022年冬奧會(huì)和冬殘奧會(huì)上,科大訊飛擔(dān)綱官方自動(dòng)語音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商,是科技發(fā)展的大勢(shì)所趨,也是自身核心技術(shù)發(fā)展的水到渠成。然而,由于自動(dòng)語音轉(zhuǎn)換與翻譯涉及技術(shù)眾多,難度和挑戰(zhàn)非常大,科大訊飛在為賽事提供技術(shù)支持的過程中,也遇到了不少難點(diǎn)。

在多語種語音語言技術(shù)研發(fā)領(lǐng)域,由于涉及60多個(gè)語種的語音識(shí)別合成翻譯等技術(shù)研發(fā),除了中英文之外,針對(duì)其他語種(比如瑞典語、波蘭語等)語料比較少的問題,通過源頭核心技術(shù)創(chuàng)新,在端到端建模和無監(jiān)督、弱監(jiān)督訓(xùn)練方面取得重大突破,例如在多語種語音識(shí)別方面,100小時(shí)有監(jiān)督數(shù)據(jù)加上大量無標(biāo)簽語音和文本數(shù)據(jù)可以達(dá)到1萬小時(shí)有監(jiān)督訓(xùn)練的效果。這項(xiàng)技術(shù)也在OpenASR國際低資源多語種語音識(shí)別挑戰(zhàn)賽的15個(gè)語種受限賽道和7個(gè)語種非受限賽道系統(tǒng),全部取得第一名的成績。

在語音同傳技術(shù)實(shí)時(shí)性和效果的平衡上,我們知道,同傳要解決兩個(gè)問題,第一是要將語音識(shí)別轉(zhuǎn)寫出來,第二是將轉(zhuǎn)寫的內(nèi)容翻譯出來,以前這兩個(gè)任務(wù)是單獨(dú)建模先后完成的,現(xiàn)在我們提出“流式的CAAT語音翻譯框架”模型,在一個(gè)模型內(nèi)解決這兩個(gè)問題,從而實(shí)現(xiàn)同傳效果的“又快又好”。這些技術(shù)創(chuàng)新,對(duì)于保障冬奧場(chǎng)景下的語音同傳應(yīng)用效果起到非常關(guān)鍵的作用。

在多語種自動(dòng)問答中,融合了數(shù)字人生成、語音識(shí)別、語音合成、自然語言理解等多項(xiàng)技術(shù),并結(jié)合FAQ問答、文檔集合問答、知識(shí)庫問答和基于文本蘊(yùn)含識(shí)別的多源答案驗(yàn)證等技術(shù)進(jìn)行知識(shí)庫構(gòu)建,最終實(shí)現(xiàn)人們可以和冬奧虛擬志愿者“愛加”用六種語言自由互動(dòng)交流。

講好中國故事、傳遞中國聲音,科大訊飛自創(chuàng)建以來始終致力于語音及語言、自然語言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究,在行業(yè)發(fā)展史上樹立了從“能聽會(huì)說”到“能理解會(huì)思考”的關(guān)鍵里程碑。此次擔(dān)當(dāng)北京2022冬奧會(huì)和冬殘奧會(huì)官方自動(dòng)語音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商,科大訊飛更是不斷攻堅(jiān)克難,突破了多語種語音語言技術(shù)的研發(fā)、語音同傳技術(shù)實(shí)時(shí)性和效果的平衡、多語種智能(自動(dòng))問答三大技術(shù)難題,讓多語種交流、同傳又準(zhǔn)、又好、又快,真正實(shí)現(xiàn)了交流無國界、溝通無障礙。讓我們一起,為中國技術(shù)實(shí)力點(diǎn)贊!

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片