首頁>資訊 >
與動物語言交流,這件人做不到的事,AI能勝任? 2021-11-16 18:22:12  來源:36氪

你看過《忠犬八公的故事》嗎?

這部評分很高的電影,完美詮釋了秋田犬小八和主人公帕克之間的情誼。小八每天都想方設法去車站等已故的主人,風雨無阻,一等就是十年。還有不少優(yōu)秀的影視作品都反映了同一個主題:人和動物的交流。了解動物是一個難題。首先,動物甚至有“語言”嗎?如果它們有自己的語言,除了生存的基本知識之外還有很多話要說嗎? AI 正在幫我們解答這些問題。

“神秘外星人”

使用 AI 探索動物語言是合理的。畢竟,人工智能已被證明在破譯古代人類語言方面非常有效。一個由國際科學家組成的團隊,最近發(fā)起了一個雄心勃勃的"鯨語翻譯計劃"(Project CETI)。他們選擇的研究對象生活在充滿神秘魅力的藍色海洋中,是一種極具情感和智慧的、令人著迷的“神秘外星人”:抹香鯨(Physeter macrocephalus)。抹香鯨外形龐大,體型似魚,用肺呼吸,體重超過 50 噸,體長可高達 18 米,屬于體型最大的齒鯨;頭部巨大,可占整個身體的 1/3,下頜較小,僅下頜有牙齒,頸部較短,鼻孔為噴孔,位于吻端,前肢成鰭,前臂和后肢退化,無背鰭,尾似魚,靠尾擺動;具有極強的潛水能力,不僅在深度上,而且在下潛時間上都是哺乳動物的 No.1。

圖丨你可能想不到它的主食是什么吧?深海中的大王烏賊是它的最愛

受“探索外星智能”(SETI, search for extraterrestrial intelligence)的啟發(fā),項目負責人 David Gruber 聯(lián)合科學家和研究者們試圖進行一次前所未有的探索: 破譯抹香鯨的語言,以實現(xiàn)人鯨對話。由此,鯨類翻譯計劃(Project CETI , Cetacean Translation Initiative)誕生了。通過傾聽、解讀抹香鯨的聲音,獲得與它們交流的方式,以運用最前沿的技術來造福人類,造福地球的生物,達到珍愛生命、保護生命、人與自然的和諧共處的宗旨。該項目采用非營利性的模型,由來自紐約城市大學、UC 伯克利、MIT、哈佛、谷歌研究院和《國家地理》等知名學府、研究和環(huán)保機構的多領域專家共同組成,匯集了頂尖的密碼學家、機器人專家、語言學家、AI 專家、技術專家和海洋生物學家。他們一致認為,只有采用跨學科的研究思路,將相關方向的專業(yè)知識融會貫通,才能更全面、深入、透徹的了解鯨類的語言。其關鍵步驟如下:

記錄:從各種傳感器收集鯨魚通信和行為數(shù)據(jù)的大型縱向的多模態(tài)的數(shù)據(jù)信息;

過程:協(xié)調和處理多傳感器的數(shù)據(jù);

解碼:借助 ML 技術,構建鯨魚的交流模型并描述其結構,將其與行為緊密聯(lián)系起來;

編碼和回放:通過一次次的交互式播放實驗,改進并完善鯨魚語言模型。

因而,多種最新的技術也有了更廣闊的用武之地,涵蓋 AI、機器學習(ML, Machine Learning)、密碼學和機器人技術等等。

正如阿波羅計劃的地球上升照片一樣,CETI 的發(fā)現(xiàn)和進步極有可能重塑人類對其在這個星球上所處地位的理解。

該項目的主要研究工作概括為以下幾點:

開發(fā)最精密的機器人技術,包括與國家地理學會的探索技術實驗室合作,在傾聽鯨魚的聲音的同時,將其聲音融入語境之中。

部署“核心鯨魚監(jiān)聽系統(tǒng)”,這是一種新穎的水聽器陣列,可用于研究 20×20 公里的野外地點的鯨群。

多米尼加的抹香鯨項目成效顯著,已捕獲了關于鯨魚聲音、社會生活和行為的大量數(shù)據(jù)。

創(chuàng)建大數(shù)據(jù)管道,以檢查記錄的數(shù)據(jù),并使用先進的 ML、自然語言處理(NLP, Natural Language Processing)和數(shù)據(jù)科學(DS,Data Science)對其進行解碼。

增強伙伴合作關系,啟動公共界面、數(shù)據(jù)可視化、溝通平臺和領導力倡議,以參與并促進全球社區(qū)的發(fā)展。

圖 |鯨魚生物聲學數(shù)據(jù)收集的示意圖

第一個問題,為什么選擇的是抹香鯨呢?

在此,我們解答你心中的第一個疑問:人類借 AI 嘗試和動物交流,為什么要選抹香鯨?其實,相對于所有的生物而言,抹香鯨擁有最大的大腦,并且與人類有著驚人相似的特征。 抹香鯨具有更高層次的功能,如有意識的思考和未來規(guī)劃,有豐富的情感體驗,可以表達和感受同情、愛、痛苦和直覺等等。它的生物聲學系統(tǒng)如下圖所示。在 A 中,抹香鯨頭包括鯨蠟器官(c),一個充滿近 2000 升蠟狀液體的腔體,以及垃圾艙 (f),包含一系列起到聲透鏡作用的晶圓狀體。兩者相當于兩個連接管,在大型成熟雄鯨中形成一個長約 10 米、孔約 0.8 米的彎曲圓錐形角。在頭部前側的“聲唇”(i)發(fā)出的聲音,通過彎曲的喇叭進行傳遞,在出口表面產生平坦的波面。而 5-B 中展示的是,抹香鯨回聲定位和尾波咔噠聲的時間結構。

另外,它們生活在母系社會和多元文化社會,有方言和強大的多代家庭紐帶?,F(xiàn)代鯨魚作為海洋環(huán)境的超強“管家”,已有超過 3000 萬年的歷史了,從時間節(jié)點上看,已是最早原始人類的5倍,而我們對這些動物的了解才只是剛剛開始。

第二個問題,為何現(xiàn)在去研究?

這個問題得從 20 世紀 60 年代末的一個發(fā)現(xiàn)說起。當時,包括 CETI 首席顧問 Roger Payne 博士在內的科學家發(fā)現(xiàn),鯨魚會彼此唱歌。如下圖所示,他的唱片《座頭鯨之歌》掀起了一場聲勢浩大的“拯救鯨魚”運動,這是歷史上最成功的保護行動之一。

這場運動最終推動了《海洋哺乳動物保護法》的頒布,該法案標志著大規(guī)模捕鯨時代的結束,并有效拯救了幾個瀕臨滅絕的鯨魚種群,留存下了地球上最神秘的聲音。迄今為止,工程學、AI 和語言學的進步使得更深入地了解鯨魚和其他動物的交流成為可能,打破了之前遙不可及的神話。在這個項目中,他們會使用自然語言技術來研究分析抹香鯨的 40 億個交流代碼,將每個聲音與特定的背景聯(lián)系起來,這一過程至少需要五年時間。 如果該團隊實現(xiàn)了這些目標,下一步將是開發(fā)和部署一個互動聊天機器人,與生活在野外的抹香鯨進行對話。

第三個問題,AI 讀懂動物“語言”的潛力如何?

我們都知道,人類通常非常擅長識別他們熟悉的動物叫聲的聲學差異。而隨著基于信號分類算法變得更加先進,我們有理由相信,人工智能將很快達到可以比人類做得更好。現(xiàn)在已經(jīng)看到一些成功的跡象。2017 年,科學家們開發(fā)的程序,能夠以大約 90% 的準確率識別出許多不同的狨猴叫聲。狨猴是群居的群居動物。他們的“詞匯”包括 10 到 15 個叫聲,每個都有自己的含義。研究表明,像人類嬰兒一樣,小狨猴通過聽到其他狨猴與它們交談來學習交流。猴子類人的交流系統(tǒng)使它們在研究語言、社會交流或發(fā)聲的科學家中很受歡迎,攜帶自閉癥相關突變的狨猴也是研究改良這種疾病的良好模型。

一支麻省理工團隊開發(fā)了一種算法,將來自狨猴呼叫的頻率模式轉換為圖片,然后將這些類似字母的圖像傳遞給人工神經(jīng)網(wǎng)絡進行分類。最終,該算法以 80% 的準確率從背景噪音中篩選出猴子的談話,并且在 90% 以上的情況中正確識別出猴子發(fā)出的聲音。同年,另一個團隊讓 AI 僅根據(jù)給羊的面部表情來識別羊是不是處于困境之中。在這項研究中,劍橋大學團隊首先根據(jù)綿羊疼痛面部表情,列出了與不同疼痛程度相關的幾個“面部動作單元”(AU),然后在 480 張綿羊照片中手動標記了這些 AU——鼻孔變形、每只耳朵的旋轉和每只眼睛的縮小等等。然后,他們訓練機器學習算法通過將 90% 的照片及其標簽提供給它,并在剩余的 10% 上測試該算法。最終,該程序識別 AU 的平均準確率為 67%,與普通人的準確率差不多。而且,改進訓練程序還能進一步提高了準確性。團隊認為,他們的方法也適用于其他動物,可以為動物帶來更好的診斷和治療方案。未來,如果能同時結合聲音+圖像的想法,我們可以更全面地了解動物可能想說什么。借助 AI,擁有一個能夠翻譯動物語言的“谷歌翻譯”固然是好事,更重要的是,目前一些物種正處于生存的關鍵時刻,隨著技術的進步和成熟,我們可以在技術的支撐下,建設一個對人類和動物都更光明、更密切的未來。

本文來自微信公眾號 “學術頭條”(ID:SciTouTiao),作者:學術頭條,36氪經(jīng)授權發(fā)布。

關鍵詞: 這件 人做 動物

相關閱讀:
熱點
圖片 圖片