首頁>資訊 >
聊什么來什么,你跟我說手機沒偷聽? 2022-12-08 15:01:02  來源:36氪

你和朋友坐在一起聊天,隨手把手機扔桌上。你問他,家里暖氣不熱怎么辦?夜晚,你便在小紅書的信息流里刷到“教你給暖氣放氣”。你人一驚,心想“難道又被手機竊聽了?”因為你從未主動搜索過類似話題。

如果確實存在“App 監(jiān)聽談話”,那其目的大多是為了各種應(yīng)用平臺信息、商品、廣告的精準推送,但這卻是個人信息(或隱私)獲取的眾多方式中,最為敏感,也最不“劃算”的一種。它被反復(fù)提及,原因是用戶總能發(fā)現(xiàn)“巧合”,卻難以對其證實。相關(guān)商業(yè)公司也只是否認,拿不出反駁證據(jù)。


【資料圖】

如果 app 真的通過麥克風(fēng)一直監(jiān)聽我們,到底可不可行?

語音助手先遭質(zhì)疑

人們的確曾抓到過智能音箱和語音助手的把柄,亞馬遜 Alexa 曾因為錯誤理解指令,把“偷聽”來的談話錄音發(fā)給用戶通訊錄里的好友,證明麥克風(fēng)偷聽并非臆想。

2018 年,一對住在俄勒岡州的夫婦突然接到朋友電話,被朋友告知,收到了他們家 Echo 智能音箱發(fā)來的聊天錄音。確認了談話細節(jié),他們這才相信,被偷聽了。

他們找到亞馬遜討個說法,對方出面解釋道,有一種可能是當(dāng)事人在對話中某個發(fā)音很像“Alexa”,由此喚醒了它。在隨后的談話過程里,Alexa 錯誤地以為聽到“發(fā)送語音信息”的請求,又錯誤地聽成是某位聯(lián)系人。亞馬遜說,這種事情發(fā)生的概率極小,但也有意外。

如果不是麥克風(fēng)一直在聽,智能音箱怎么知道用戶喊它了?乍一聽,好像有點道理。

2020 年,一位產(chǎn)品經(jīng)理在 hackernoon(一個技術(shù)分享社區(qū))寫過一篇文章專門解釋這個困惑。他拿 Siri 舉例,說 Siri 確實在“聽”,但它“聽不懂”,直到被“Hey Siri”觸發(fā)后,它才開始理解你的指令。

Siri 確實在“聽”,但它“聽不懂”丨圖片來源 Giphy

因為 Siri 只是聽懂你在喊它,就已經(jīng)耗費很多“力氣”。落到麥克風(fēng)上的聲音會以 0.01 秒為一幀,每次 20 幀(0.2s),被輸入到深度神經(jīng)網(wǎng)絡(luò),進行本地計算。深度神經(jīng)網(wǎng)絡(luò)將這些聲音轉(zhuǎn)換成概率密度函數(shù)。當(dāng)函數(shù)值達閾值,主處理器被激活。在主處理器激活之前,處理聲音做這些事情的是協(xié)處理器。

所謂協(xié)處理器可以理解為,具備有限的功能和電量消耗的輔助處理器,允許用戶在屏幕關(guān)閉時,訪問一些“始終開啟”的功能。比如它幫助分擔(dān)處理來自加速度計、陀螺儀等的數(shù)據(jù),改善手機續(xù)航。(不然,你的運動步數(shù)是如何統(tǒng)計的?)“Hey Siri”功能推出后,它就幫著 Siri 處理聲音。Siri 理解,你不想讓它聽的聲音,它就“左耳進右耳出”。

那 app 會不會跟語音助手一樣呢?如果它“左耳進”,但“沒右耳出”呢?

“Hey Siri”可被看作是蘋果的“底層應(yīng)用”,是寫在系統(tǒng)內(nèi)部的,相比之下,iOS 系統(tǒng)之上的應(yīng)用,調(diào)用系統(tǒng)權(quán)限的時候,用戶不會那么“無感”。

技術(shù)上可以,但算不過賬來

2019 年,國內(nèi)的一個開發(fā)者團隊寫了一個安卓 app,在演示中,app 獲取“錄音”權(quán)限后,鎖屏在后臺監(jiān)聽。開發(fā)者對麥克風(fēng)說,“今晚吃什么?”服務(wù)器端就收到 app 上傳的語音轉(zhuǎn)文字后的信息。他們?yōu)榱俗C明,拋開所有限制條件,僅從技術(shù)角度來說,“app 在后臺監(jiān)聽到用戶說什么”是可行的。

為什么強調(diào)“僅從技術(shù)上”?因為想要完全繞過用戶的注意,實現(xiàn)“偷”聽,難度可就大了。2017 年,F(xiàn)acebook 廣告負責(zé)人 Antonio García Martínez 在《連線》上撰文。他說,如果 Facebook 通過麥克風(fēng)記錄聽到的所有內(nèi)容,在功能上等同于用戶和 Facebook“一直通電話”。

如果 Facebook 通過麥克風(fēng)記錄聽到的所有內(nèi)容,在功能上等同于用戶和 Facebook“一直通電話”丨圖片來源 Giphy

有人做了實驗,錄音一小時(采樣率 48khz,比特率 256kbps),文件大小達 112.39M,消耗電量 6%。低功耗長時間的錄音,耗電量不是很大。如果多個 app,多個 SDK 同時使用該方式,手機會變得又熱又燙。

如果你手邊正好有一臺 iPhone 6,打開 Siri 設(shè)置會發(fā)現(xiàn),那時“Hey Siri 只有在充電時才能用”。得益于低功耗的 M9 協(xié)處理器,蘋果在 iPhone 6s 推出時,才首次加入始終聆聽“Hey Siri”功能。

低功耗長時間的錄音,耗電量不是很大,如果十個一起呢?丨圖片來源 hackernoon

你難以想象“實時傳輸”能產(chǎn)生多少用戶數(shù)據(jù)。Martínez 假設(shè)用戶每天使用手機時長為半天,以當(dāng)時來計算,“網(wǎng)絡(luò)通話”的單向傳輸速率平均 24kbps,每人每天傳輸數(shù)據(jù)大約 130MB。當(dāng)時 Facebook 僅在美國的日活是 1.5 億,每天產(chǎn)生大約 20PB 數(shù)據(jù)。Facebook 數(shù)據(jù)庫中存儲了 300PB 的數(shù)據(jù),每天處理的數(shù)據(jù)量大約 600TB。這樣一算,監(jiān)聽所產(chǎn)生的音頻數(shù)據(jù)就是每天要處理的 33 倍了。即便公司體量如 Facebook,也難承其重。

如果使用語音壓縮技術(shù),再分段傳給服務(wù)器存儲,再去處理呢?

以 iLBC 語音編解碼器為例,采用 20ms 的幀格式,語音數(shù)據(jù)經(jīng)過編碼之后的速率為 15.2Kbps,每分鐘數(shù)據(jù) 112KB。即便每天只監(jiān)聽用戶 1 個小時,每年產(chǎn)生的數(shù)據(jù),也會用掉用戶 2.5GB 內(nèi)存。

也許有人仍有疑問。既然這條路行不通了,手機、app 廠商可以在本地將“語音轉(zhuǎn)文字”,過濾后提取有價值的信息,再上傳到后臺服務(wù)器。拋開這樣做后臺運算會“吞噬”CPU,造成手機性能下降不說,擔(dān)負的成本也不低。

Google 以 0.006 美元/15 秒向第三方出售其“語音轉(zhuǎn)文字”服務(wù)。(一個用戶)每天轉(zhuǎn)寫 24 小時的成本是 12614 美元,即便每天轉(zhuǎn)寫 1 小時也得 525 美元。

2021 年初,時任(中國)App 治理工作組技術(shù)專家何延哲在做了實驗和檢測之后稱,目前還沒有發(fā)現(xiàn)哪款 app 有把語音信息上傳之后的偷聽行為。

來,我們簡單測試下

根據(jù)各個平臺的隱私政策,獲取麥克風(fēng)權(quán)限,淘寶是為了與 AI 客服對話,抖音是為了拍攝短視頻作品,百度是為了語音搜索。

我做了一次從個人消費者出發(fā)的測試,想去證實兩個懷疑,這三款主流的 app 有沒有在無感知(沒有啟用麥克風(fēng))的情況下,錄下我的對話;并將此用于 app 的個性化推薦和廣告系統(tǒng)。

為此我盡可能規(guī)避其他變量,用一臺抹掉所有內(nèi)容和設(shè)置,并升級到 iOS15 以上的 iPhone 7 Plus 進行測試。并且注冊了以上三款 app 的新賬戶。

先將淘寶獲取麥克風(fēng)權(quán)限,置于前臺,連續(xù)兩天,每次 30 分鐘以上對麥克風(fēng)“輸入”與乒乓球有關(guān)的音頻和對話。再將 app 放在后臺,重復(fù)以上操作。對抖音,百度重復(fù)上述操作。

兩天測試之后,我開始檢驗。首先,一旦我試圖在三款 app 中,啟用麥克風(fēng)(無論進行語音搜索,還是錄視頻),在手機狀態(tài)欄都有麥克風(fēng)啟動提示。

在淘寶的推薦頁面下,我下滑 100 個頁面(標準版,每個頁面大概四個推薦結(jié)果),沒有推薦與乒乓球相關(guān)的商品和廣告;在抖音的推薦頁面下,我連續(xù)刷 100 個視頻,沒有出現(xiàn)與乒乓球有關(guān)的視頻內(nèi)容;同樣在百度的前 100 個推薦結(jié)果里,沒有出現(xiàn)與之相關(guān)的新聞標題。

至少在這次實驗中,app 調(diào)用麥克風(fēng)時無法不被察覺,也沒有將我的談話內(nèi)容,和周圍環(huán)境聲音,“轉(zhuǎn)化為”個性化推薦。

以為麥克風(fēng)在偷聽,是我的問題嗎?

就像開篇提到的“供暖”例子,基于社交媒體對用戶的了解,你可能已經(jīng)被準確打上“年輕女性”、“北漂”標簽,恰好“北京供暖”這個話題搜索熱度高。帖子可能被推給了 10 萬打著同樣標簽的人,其中恰好包括你,你理所當(dāng)然地認為自己被監(jiān)聽了。

這可能是證實偏差(confirmation bias)在作祟。證實偏差是一個心理學(xué)上的概念,它就像腦中的過濾器,留下你認為正確的。而把那些與需要不相關(guān)的其他信息無意識地過濾掉,選擇性注意。它也被稱“視網(wǎng)膜效應(yīng)”,或“孕婦效應(yīng)”。

證實偏差就像腦中的過濾器丨圖片來源 Giphy

類似例子非常常見。2008 年美國大選時期,研究者發(fā)現(xiàn)支持奧巴馬當(dāng)選的選民購買了更多正面描寫奧巴馬的書,反對者則是那些批評奧巴馬書籍的主要買家。很多時候我們不可避免地帶入這種“主觀性”,它是影響我們大腦做出正確判斷的主觀因素。

你與男朋友在外散步,討論起最近搬家,話中談及買什么牌子的投影儀好。結(jié)果你晚上回家刷手機,不僅在社交媒體上被推薦中介看房,淘寶還給你推送了新款投影儀。這時候,你剛準備跟男朋友炫耀“我就說,手機一定在竊聽我們?!钡鹊龋潇o了一下,回憶起自己出門根本沒帶手機。

這種情況之所以發(fā)生,也許是你的男朋友已經(jīng)在網(wǎng)上瀏覽過搬家,如何挑選投影儀。而你們因為在網(wǎng)絡(luò)上互為好友,被監(jiān)測到相互轉(zhuǎn)發(fā)等行為,已經(jīng)被廣告系統(tǒng)標注為“有共同興趣”。

所以廣告系統(tǒng)已經(jīng)這樣成熟了嗎?

沒必要!真的沒必要!

至少在商業(yè)消費領(lǐng)域,通過“偷”聽來獲得的用戶數(shù)據(jù),質(zhì)量不見得高,但需要付出的成本極其高昂,公司沒必要為此買單。

2018 年,今日頭條在被質(zhì)疑通過麥克風(fēng)獲取個人隱私時回復(fù),他們的做法是“除非用戶明確點擊授權(quán),否則無法收到用戶的語音信號。”

幾乎所有主流 app 都表明類似立場。因為對于第三方 app 來說,它們想不為用戶發(fā)覺,或突破系統(tǒng)權(quán)限進行監(jiān)聽幾乎不可能。iOS14(Android12)升級后,只要麥克風(fēng)啟動,就會在下拉狀態(tài)欄的屏幕上方有所提示。

比起用麥克風(fēng)竊聽,商業(yè)公司有更成熟的“畫像”方法。那些你看到的精準推送,可以基本上歸因于大數(shù)據(jù)分析的結(jié)果。

如果投影儀廠商想投放廣告,它可能會找任意一家互聯(lián)網(wǎng)平臺投放,后者根據(jù)在授權(quán)信息中出現(xiàn)“投影儀”、“電影”等相關(guān)標簽的用戶來推送。整個投放過程通過程序化廣告系統(tǒng)自動完成。

那這些相關(guān)標簽是如何建立的呢?

App 獲取的第一個信息,就是移動設(shè)備標識號,在安卓手機上叫 IMEI,在 iPhone 上叫 IDFA。這跟注冊、登陸該 app 無關(guān),即便沒有,用戶的行為數(shù)據(jù)一樣會被采集。這些行為數(shù)據(jù)里,你做了什么(觀看、評論、購買等),停留時長,是一時興起還是長期需求等,被賦予不同權(quán)重,構(gòu)成一個興趣模型的基本組成部分。

那些你看到的精準推送,可以基本上歸因于大數(shù)據(jù)分析的結(jié)果。丨圖片來源 Giphy

經(jīng)過一段時間對你的觀察,模型就能給你的某個“興趣標簽”打分,并通過多個興趣標簽值,刻畫出一個越來越“立體”的你。商業(yè)公司將無數(shù)個“你”進行分類,把同樣的廣告推給和你一樣的人。讓你有了平臺好像比你更懂自己的“錯覺”。App 可以根據(jù)你的 IDFA 跟蹤你在其他 app 上的行為。這就是你為什么剛在淘寶上搜索“投影儀”,就在刷抖音的時候,看到淘寶的投影儀廣告了。

今天的廣告系統(tǒng)還能通過“依存關(guān)系”給你推薦。出于對隱私保護,iOS13 新增如果想要獲取 Wi-Fi 名稱,需要在調(diào)用接口前獲得用戶的定位權(quán)限。因為通過 Wi-Fi 信息可以定位到用戶地理位置。但不代表不給定位權(quán)限,app 就沒法鎖定你了。App 還能通過同一局域網(wǎng)下的設(shè)備來跟蹤。

因此 iOS 14 中新增了“本地網(wǎng)絡(luò)”權(quán)限。App 想要訪問同一局域網(wǎng)下的其他設(shè)備,需要經(jīng)過你的授權(quán)(在此之前不需要)。

通過獲取設(shè)備的 MAC 地址(唯一的網(wǎng)絡(luò)標識),獲知某個局域網(wǎng)下,連接的電子設(shè)備型號,以及你的“關(guān)系鏈”。如果幾個用戶每晚都連同一個 Wi-Fi,那么 app 判斷他們大概率是一家人。在“大數(shù)據(jù)”的加持下,能找到 MAC 地址,與 IMEI 號的對應(yīng)關(guān)系,給你和家人推送的內(nèi)容就會交叉共享。

其實,app 偷偷摸摸收集大家信息的行為,都不來自于“聽”。

2020 年,來自浙江大學(xué)、多倫多大學(xué)、加拿大麥吉爾大學(xué)等學(xué)者展示了一項研究成果,手機 app 可在無用戶授權(quán)下,利用內(nèi)置加速傳感器采集聲音的震動信號。這種不通過麥克風(fēng)等收、錄聲設(shè)備,而是通過其他傳感器,比如陀螺儀、加速計,再通過深度學(xué)習(xí)等技術(shù)恢復(fù)語音數(shù)據(jù)的技術(shù),被稱為側(cè)信道還原技術(shù)。

同樣不易被人察覺的還有 SDK,嵌入在 app 內(nèi)提供特定功能,方便開發(fā)者開發(fā)而存在。“當(dāng) app A 和 app B 都采取了同一家廣告 SDK 時,那么 A 和 B 內(nèi)收集的數(shù)據(jù)都可能上傳至這一家 SDK 上,A 與 B 之間天然形成了數(shù)據(jù)共享。你在 A 上的搜索記錄和使用習(xí)慣有可能就會被反映在 B 上?!闭憬髮W(xué)計算機科學(xué)與技術(shù)學(xué)院周亞金教授稱。今年工信部檢測出 13 款 app 內(nèi)嵌第三方 SDK 存在違規(guī)收集用戶設(shè)備信息的行為。

2021 年,網(wǎng)信辦發(fā)布了對 33 款 app 違規(guī)收集使用個人信息情況的通報,一些耳熟能詳?shù)妮斎敕óa(chǎn)品也在其中。

商業(yè)公司如果真的企圖獲取用戶的信息,麥克風(fēng)監(jiān)聽性價比實在太低丨圖片來源 Giphy

這些違法違規(guī)的信息收集手段,都會讓我們產(chǎn)生被“監(jiān)聽”的錯覺。商業(yè)公司如果真的企圖獲取用戶的信息(甚至竊取用戶的隱私),有很多方式。相比之下,麥克風(fēng)監(jiān)聽性價比實在太低。

那我的擔(dān)心能解決嗎?

手機廠商在盡量打消人們對于“用麥克風(fēng)竊聽”的顧慮和誤解。

如上文提到,iOS14(Android12)升級后,只要麥克風(fēng)啟動,就會在下拉狀態(tài)欄的屏幕上方有所提示。App 幾乎不可能突破移動操作系統(tǒng)限制,直接調(diào)用硬件功能,實現(xiàn)用戶無感的錄音操作。利用系統(tǒng)漏洞、安裝惡意程序等方式,技術(shù)難度和法律成本都極高。

麥克風(fēng)啟用提示丨圖片來源手機截圖

首部個人信息保護法出臺。它規(guī)定,處理個人信息,應(yīng)在事先充分告知的前提下取得個人同意,不得誤導(dǎo)、欺詐、脅迫等。

同時,對于個人信息的收集,應(yīng)當(dāng)限于實現(xiàn)處理目的的最小范圍,不得過度收集個人信息。處理個人信息應(yīng)當(dāng)遵循公開、透明原則,公開個人信息處理規(guī)則,明示處理的目的、方式和范圍。這規(guī)范拿到的語音數(shù)據(jù),放在哪里,如何處理。

蘋果之前對于通過“Hey Siri”發(fā)送到服務(wù)器的語音,表示會按照隱私政策來處理,相當(dāng)于給一個隨機設(shè)備標識符,用完即“扔”。iOS15 更新后,希望將 Siri 語音處理本地化(目前國內(nèi)還不支持)。

如果用戶想打消“被偷聽的顧慮”,我們自己在客戶端還能做些什么?

用戶最先安裝 app 時,可以拒絕調(diào)用麥克風(fēng)的權(quán)限。對于已經(jīng)在使用中的 app,安卓用戶可以在“設(shè)置—應(yīng)用設(shè)置—應(yīng)用管理—某 app—權(quán)限管理—錄音”路徑下,關(guān)閉 app 對麥克風(fēng)的獲??;iOS 用戶通過“設(shè)置——隱私與安全性——麥克風(fēng)”,查看請求訪問麥克風(fēng)的應(yīng)用,并關(guān)閉。

個性化廣告已經(jīng)成為了互聯(lián)網(wǎng)廣告的一種比較常見的模式,發(fā)生推薦結(jié)果也并不意味著 app 實施了監(jiān)聽。

iOS14.5 更新后,IDFA 的開關(guān)狀態(tài)由“默認開啟”改為“默認詢問”。如果你此前沒有關(guān)注到這一點,可以在“設(shè)置—隱私與安全性—跟蹤”下,查看哪些 app 使用標識符來跟蹤你,并且關(guān)閉它。

關(guān)閉程序化廣告,廣告相關(guān)度會降低丨圖片來源 Giphy

當(dāng)然看到 app 里的個性化廣告時,你總不免焦慮,時常擔(dān)心到底哪一個行為暴露了自己的信息和喜好?,F(xiàn)在你可以手動關(guān)閉它們。

2019 年,澎湃新聞的記者發(fā)現(xiàn),在今日頭條 app 中關(guān)閉程序化廣告后,用戶看到的廣告數(shù)量保持不變,但廣告相關(guān)度會降低。南都在 2020 年的《個人信息安全年度報告》中對 50 款頭部 app 測評,發(fā)現(xiàn)六款沒有提供個性化推薦關(guān)閉選項。兩年之后,這些頭部 app 均已增加了這一選項。

個性化推薦選項一般在 app 各自的設(shè)置里,拿淘寶舉例,通過“我的淘寶——設(shè)置——隱私——推薦管理——關(guān)閉個性化推薦”。

好了,這下手機不會“搶答”了。

參考文獻

[1]https://hackernoon.com/how-does-hey-siri-work-without-your-iphone-listening-to-you-at-all-times-827932do

[2]https://mp.weixin.qq.com/s/lXqmU97nVBcKxklqYCpbhQ

[3]https://www.wired.com/story/facebooks-listening-smartphone-microphone/

[4]https://cloud.google.com/speech-to-text/pricing

[5]https://www.guokr.com/article/4935/

[6]https://sspai.com/post/61223

[7]https://www.androidauthority.com/your-phone-is-not-listening-to-you-884028/

[8]https://www.ndss-symposium.org/wp-content/uploads/2020/02/24076.pdf

[9] https://mp.weixin.qq.com/s/X5sVzp7nY-MoY542Uep61g

關(guān)鍵詞: 個人信息 協(xié)處理器 證實偏差

相關(guān)閱讀:
熱點
圖片 圖片