亚洲精品无码专区在线在线播放,99久久婷婷国产综合亚洲

首頁>資訊 >

今年AI論文8大領(lǐng)域突破：特斯拉自動駕駛?cè)脒x，視頻博主最利好，跨界輸出很潮流 2021-11-15 15:22:44　　來源：36氪

自動駕駛、圖像生成、2D轉(zhuǎn)3D……

2021年，哪些AI論文最火？又是哪些論文最具突破性？

最近一位éTS研究生、YouTube博主總結(jié)了今年AI最新突破列表，視頻、文章和代碼一應(yīng)俱全。

我們從中梳理出八大類，就跟大家一起來康康～

視頻博主看過來

從中梳理最多的，當(dāng)屬一些利好視頻博主的技術(shù)了。

比如，這個TimeLens，它可以制作慢動作視頻，最大范圍可從原有的30幀擴(kuò)展成900幀。

再比如，這個編輯神器VGPNN——單個視頻幾秒內(nèi)多樣化生成。

像刪除或添加某人、改變背景、時間拉長、改變長寬比、分辨率等功能在它面前，都是基本操作。

還有像在不影響背景或其他對象情況下，移動圖像中的對象；使用AI分離真實世界中的聲音，語音、音樂和音效之類……

具體在畫質(zhì)處理上，今年英特爾就用英偉達(dá)顯卡做了畫質(zhì)增強(qiáng)補(bǔ)丁。今年6月，這個Demo在全網(wǎng)火了一把。

為了在GTA上效果更真實，研究人員改變了視頻中3點(diǎn)特征：增加汽車的光澤、改善植被的整體外觀、讓瀝青路面看起來更光滑。

對此，有網(wǎng)友表示，這比路徑追蹤便宜多了。

如果說肆掠的疫情讓視頻會議火了一把，那么視頻會議軟件讓背景替換技術(shù)搬到了臺前。

谷歌研究員就提出了一種重新光照的方法Total Relighting，來給人像做背景替換。

它能根據(jù)新添加的場景光線，重新點(diǎn)亮任何肖像，以此看起來更加真實。

這一方法還可進(jìn)一步延伸至電影、專業(yè)視頻制作中，up主可以用起來。

此外，除了背景替換，還有文字替換，風(fēng)格還保留的那種。

今年，F(xiàn)acebook提出了一種AI模型，它可以直接翻譯或編輯圖像中的文本，并且遵照同樣的風(fēng)格。

類似這樣～

DALL·E領(lǐng)銜的圖像生成

圖像生成領(lǐng)域，最具突破性的當(dāng)屬DALL·E——OpenAI在新年推出的“AI設(shè)計師”，吳恩達(dá)點(diǎn)贊的那種。

簡單來說就是，提出你的文本需求，它來生成圖像。從原理上看，類似于GPT-3在文本合成圖像方向上的擴(kuò)展版。

比如輸入“OpenAI公司門面”，它就能給出十幾張設(shè)計圖供你選擇。

還有像根據(jù)手繪草圖來生成圖像、使用隨機(jī)微分方程進(jìn)行圖像合成和編輯等進(jìn)展。

2D圖像生成3D模型

這是除圖像生成外，另一個2021 AI領(lǐng)域熱度極高的研究方向。

試想一下，如果只在現(xiàn)實生活中拍攝一張對象照片，就可創(chuàng)建3D格式將其插入視頻或者游戲中，會有多酷。

谷歌研究院提出的ShaRF就可以做到，比如隨意拍的一個椅子。

英偉達(dá)也提出了類似的解決方案GANverse3D，只需一張圖像，就可創(chuàng)建可自定義的3D動畫。

還有前段時間火爆外網(wǎng)的假3D場景，也是通過一組照片渲染出來的。

以及LASR模型——從短視頻中單拎出一個對象來，創(chuàng)建人類或動物的3D模型……類似的方法還有很多。

萬物皆可與Transformer結(jié)合

你是否想過把CNN與Transformer結(jié)合起來？

2021年，“跨界輸出”在AI領(lǐng)域掀起潮流。

基于CNN效率和Transformer的表達(dá)能力，德國海德堡大學(xué)的研究人員提出一種高分辨率圖像生成的方法——Tl;DR。

還不只是CNN和Transformer。

斯坦福和Facebook的研究人員提出GANsformers——基于StyleGAN2架構(gòu)中Transformer的注意力機(jī)制，來生成場景圖片。

應(yīng)用層：試衣間、天氣預(yù)報

除此之外，還有原有模型基礎(chǔ)上應(yīng)用層面的延伸。

就如谷歌提出了基于StyleGAN2架構(gòu)的改進(jìn)版，創(chuàng)建了一個AI在線試衣間。

只需要提供一張你的圖像，就能自動試穿任何衣服。

還有像巴塞羅那大學(xué)的研究人員開發(fā)了一種基于深度學(xué)習(xí)，能從航拍圖像中自動檢測漂浮的垃圾，并計算數(shù)量。

為此，他們還制作了一個APP，用戶可在海面圖像中識別這些垃圾。

還有Apple提出應(yīng)用在相冊的ML算法，在iOS 15上自動識別私人照片中的人；DeepMind提出了一個使用雷達(dá)深度生成模型，來更準(zhǔn)確的預(yù)報天氣。

AI驅(qū)動的賽博朋克手臂

明尼蘇達(dá)大學(xué)的研究人員打造了一款賽博朋克手臂——AI驅(qū)動的神經(jīng)接口。

據(jù)介紹，截肢者可以像尋常人一樣靈巧的控制手臂。

編程神器：GitHub Copilot

對于開發(fā)者而言，今年最具突破性的進(jìn)展莫過于編程神器——GitHub Copilot，由GitHub與openAI聯(lián)合開發(fā)。

只需描述出你想要執(zhí)行的命令，就能生成相應(yīng)的代碼。

甚至程序員只要寫下一段注釋，Github Copilot就可以補(bǔ)全剩下的代碼、提出改進(jìn)的建議，為程序員省去大量查找的時間。

特斯拉的自動駕駛

值得一提的是，這次還有特斯拉的自動駕駛?cè)脒x。

在特斯拉的AI day上，人工智能總監(jiān)Andrej Karpathy展示了特斯拉如何通過8個攝像頭來獲取圖像到道路導(dǎo)航的過程。

這當(dāng)中包括壓縮數(shù)據(jù)、二維轉(zhuǎn)變?yōu)槿S輸出等操作。

……

除此之外，還有像面對第三次人工智能浪潮，研究人員對AI中快與慢思考；AI偽造類似“探探”個人檔案，來探討人類會不會向右滑動；Transformer是如何在CV領(lǐng)域取代CNN的？

感興趣的旁友，可戳下方鏈接了解更多詳情哦～

目前仍在更新當(dāng)中。

GitHub鏈接：https://github.com/louisfb01/best_AI_papers_2021

本文來自微信公眾號“量子位”（ID:QbitAI），作者：楊凈，36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞：特斯拉利好潮流

相關(guān)閱讀：

熱點(diǎn)

維權(quán)

圖片圖片

資訊推薦

熱門排行