首頁>資訊 >
最新消息:錯(cuò)誤鏈?zhǔn)椒磻?yīng):你看到的權(quán)威理論,可能沒有那么可靠 2022-09-14 05:39:12  來源:36氪

1

前段時(shí)間,學(xué)術(shù)界爆出一個(gè)大丑聞,《發(fā)現(xiàn)》雜志經(jīng)過調(diào)查,認(rèn)定一篇由著名神經(jīng)科學(xué)家Karen Ashe為通訊作者、于2006年發(fā)表在Nature上的文章,使用了多張經(jīng)過篡改的圖像。而這篇文章曾被引超過2300次,是阿爾茨海默癥“淀粉樣蛋白”假說領(lǐng)域的奠基性工作,全球各大公司一半的研發(fā)費(fèi)用都放在這個(gè)方向上。

后果有多嚴(yán)重,還有爭議,這不是本文要討論的重點(diǎn)。我想說的是,在結(jié)論相對明確的自然科學(xué)界,又這么重要的奠基性文章都有問題,可想而知,在社會科學(xué)領(lǐng)域,有更多的我們深信不疑的理論,問題可能更嚴(yán)重。


(資料圖片)

特別是在心理學(xué)、經(jīng)濟(jì)學(xué)之類可以用統(tǒng)計(jì)數(shù)據(jù)和數(shù)學(xué)公式偽裝成自然科學(xué)的領(lǐng)域,那些理論、假說,常常用于營銷、服務(wù)等有經(jīng)濟(jì)利益的活動,更是值得我們警惕。

2

行為經(jīng)濟(jì)學(xué)的經(jīng)典著作《思考,快與慢》一書中,曾經(jīng)用“大數(shù)效應(yīng)”為理論依據(jù),批評很多研究成果樣本數(shù)不足,但立刻就有人指出,本書中大量引用的社會心理學(xué)的“啟發(fā)效應(yīng)”,其實(shí)驗(yàn)同樣存在樣本數(shù)不足的問題。

“啟發(fā)效應(yīng)”可能是營銷學(xué)家和大眾媒體最喜歡引用的心理學(xué)研究,比如紐約大學(xué)心理學(xué)家約翰·巴赫的“熱咖啡效應(yīng)”,實(shí)驗(yàn)結(jié)果宣稱,一個(gè)手里捧著一杯熱咖啡的人,會增加別人對他的信任度。

果然,“啟發(fā)效應(yīng)”的大部分實(shí)驗(yàn),最后都無法重復(fù)結(jié)果,讓全世界的銷售員浪費(fèi)了大量咖啡。

甚至有很多大家耳熟能詳?shù)睦碚?,根本就不是?shí)驗(yàn)的結(jié)果,比如“啤酒與尿布”理論,說超市喜歡把啤酒放在尿布邊上,方便下班回家的年輕爸爸在買尿布時(shí),給自己帶上一罐啤酒,超市因此可以增加啤酒的銷量。

這個(gè)理論如此之有名,很多超市都做過這種嘗試,但我們幾乎看不到哪一個(gè)超市是這么陳列商品的,只能說明效果得不到銷售數(shù)據(jù)的驗(yàn)證。

事實(shí)上,最早提出這個(gè)理論的人,根本就是營銷專家,在某個(gè)課程中提到了自己曾經(jīng)看到某超市這么做,這個(gè)效應(yīng)聽上去頭頭是道,卻完全經(jīng)不起任何實(shí)驗(yàn)的檢驗(yàn)。

樣本數(shù)效力不夠是社會學(xué)實(shí)驗(yàn)的通病,這是因?yàn)?,自然科學(xué)的要素之間的獨(dú)立性比較強(qiáng),只要符合統(tǒng)計(jì)要求的樣本數(shù)就行了;但社會領(lǐng)域大部分事情之間,啤酒與尿布之間,咖啡與客戶成交之間,必然存在忽高忽低的聯(lián)系,小樣本數(shù)下,任何結(jié)論都有可能得出。

一個(gè)可靠的社會學(xué)理論,需要非常大的樣本數(shù)才有足夠效力。

比如心理學(xué)上最著名的“旁觀者效應(yīng)”,即遇到緊急情況救助時(shí),身邊的人越多,得到救助的概率反而更小。為了證明這個(gè)效應(yīng),達(dá)利和拉丹這兩位心理學(xué)家,前后十幾年時(shí)間里,設(shè)計(jì)了各種各樣的實(shí)驗(yàn),單次試驗(yàn)的樣本數(shù)也非常大,其中的電梯實(shí)驗(yàn)中,助手搭乘電梯的過程中故意丟下一些硬幣或是鉛筆,計(jì)算被對方撿起來的概率,研究團(tuán)隊(duì)安排了145名助手搭乘了1497次電梯,前后共有4813個(gè)人與他們共乘一部電梯。最后才得到結(jié)論:

當(dāng)他們只與一個(gè)人搭乘電梯時(shí),別人幫他撿起掉下的硬幣與鉛筆的概率是40%,而當(dāng)他與多個(gè)人一起搭乘電梯的時(shí)候,被幫助的概率只有20%。

即使這樣大的樣本數(shù),后來仍然有多個(gè)“旁觀者效應(yīng)”實(shí)驗(yàn)宣稱得到相反的結(jié)論,所以“旁觀者效應(yīng)”的有效性也沒有那么強(qiáng)。

說到這兒,還有一個(gè)問題,包括開頭的“淀粉樣蛋白”,這些都是非常著名的實(shí)驗(yàn),事關(guān)全球幾千萬患者的健康,為什么這么低劣的造假手段,在長達(dá)16年的時(shí)間,沒有被揭露呢?

這就是學(xué)術(shù)論文的“錯(cuò)誤鏈?zhǔn)椒磻?yīng)”。

3

有一天,某個(gè)學(xué)者(通常是社會科學(xué)領(lǐng)域)忽然產(chǎn)生了一個(gè)見識獨(dú)到、似乎很有道理的想法。

于是他設(shè)計(jì)了一個(gè)實(shí)驗(yàn)去驗(yàn)證,但因?yàn)榻?jīng)費(fèi)有限,或者說,社會科學(xué)領(lǐng)域太容易出想法了,平攤下來實(shí)驗(yàn)經(jīng)費(fèi)就有限了,他不得不縮減整個(gè)實(shí)驗(yàn)的時(shí)間,并虛報(bào)實(shí)驗(yàn)對象的樣本數(shù)。

非常幸運(yùn)的是,他得到了驚人的顯著性統(tǒng)計(jì)效果,論文發(fā)表后,成為當(dāng)年該領(lǐng)域的重大成果——事實(shí)上,這個(gè)想法早有人嘗試,只是因?yàn)閷?shí)驗(yàn)效果不明顯而被擱置。

更多的研究者開始跟進(jìn)研究,但不是重復(fù)這個(gè)實(shí)驗(yàn),為了讓自己的研究更有創(chuàng)新性,他們會改進(jìn)這個(gè)實(shí)驗(yàn)的某些條件,以得到進(jìn)一步的研究成果。

非常不幸的是,跟進(jìn)的研究者大部分無法重復(fù)這個(gè)結(jié)果,他們怎么辦呢?

如果實(shí)驗(yàn)結(jié)果完全無效,這些研究者會將之束之高閣,趕快進(jìn)行下一項(xiàng)研究,而不是發(fā)表文章質(zhì)疑這個(gè)結(jié)果;

如果實(shí)驗(yàn)結(jié)果有效但不明顯,很多人會懷疑是自己設(shè)計(jì)或操作上的問題,要么修改結(jié)果,要么剔除一部分他認(rèn)為不正確的結(jié)果,以增加顯著性。

于是,越來越多的新實(shí)驗(yàn),“證實(shí)”了這個(gè)假說,它也從學(xué)術(shù)領(lǐng)域進(jìn)入大眾視野。

直到有一天,某個(gè)認(rèn)死理的研究者,為了搞清楚自己實(shí)驗(yàn)失敗的原因,完全重復(fù)了數(shù)遍最初的實(shí)驗(yàn)……

4

總結(jié)這個(gè)“鏈?zhǔn)椒磻?yīng)”,導(dǎo)致錯(cuò)誤不能被及時(shí)糾正的三個(gè)原因出自人性的弱點(diǎn):

1、學(xué)者發(fā)論文壓力大,實(shí)驗(yàn)必須要成功

2、習(xí)慣于修辭數(shù)據(jù),以讓結(jié)果看起來更有說服力

3、質(zhì)疑權(quán)威的風(fēng)險(xiǎn)大,延續(xù)權(quán)威結(jié)論的收益更穩(wěn)定

所以,不能因?yàn)橐粋€(gè)理論聽上去很有道理,有一堆數(shù)據(jù)和專家背書,就認(rèn)為它不可能出錯(cuò)。

曾經(jīng)有讀者批評我寫文章,不給列出引用的參考文獻(xiàn)。

我曾經(jīng)一度也這么做過,可這讓它看起來更像是一篇學(xué)術(shù)文章,暗示結(jié)論的科學(xué)性,但我本人并不確定這一點(diǎn),我沒有能力去重復(fù)那些實(shí)驗(yàn)的結(jié)果,它們只是看起來有道理,所以我希望它們以某一方面的觀點(diǎn)而不是證據(jù)的形式呈現(xiàn)。

自媒體的文章不具有學(xué)術(shù)性,無論它的形式多么像一篇論文,它們的目的只是為了完成一篇文章,而不是一項(xiàng)研究。雖然有追求的作者總是盡量選擇可靠的觀點(diǎn),但文章就是文章,追求的是閱讀率、傳播效果、而不是研究結(jié)果的可靠性。

所以,謹(jǐn)慎地對待你看到的任何權(quán)威文章,特別是那些看起來對你很有利的,引起你極度舒適的,并讓你產(chǎn)生共鳴的觀點(diǎn)。

關(guān)鍵詞: 鏈?zhǔn)椒磻?yīng) 旁觀者效應(yīng) 社會科學(xué)

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片