大數(shù)據(jù)時(shí)代,讓我們置身于智能化與大數(shù)據(jù)時(shí)代快節(jié)奏、便利化的生活方式當(dāng)中,并且通過人工智能AI技術(shù)逐步滲透到社交、購(gòu)物、出行、新聞媒體、政治事件等各個(gè)領(lǐng)域,甚至通過人工智能這種強(qiáng)大的學(xué)習(xí)能力和數(shù)據(jù)分析開始左右我們的思考、誘導(dǎo)我們的日常選擇。
美國(guó)經(jīng)濟(jì)學(xué)教授加里·史密斯的新著《錯(cuò)覺:AI如何通過數(shù)據(jù)挖掘誤導(dǎo)我們》(以下簡(jiǎn)稱《錯(cuò)覺》)一書提供了非常獨(dú)特的視角,與大多數(shù)倡導(dǎo)大數(shù)據(jù)和追逐大數(shù)據(jù)產(chǎn)業(yè)的研究者不同,史密斯教授更多的是對(duì)計(jì)算機(jī)挖掘大數(shù)據(jù)以及應(yīng)用到各個(gè)領(lǐng)域的現(xiàn)象進(jìn)行批判性研究,這項(xiàng)研究將啟迪我們思考大數(shù)據(jù)與人工智能的社會(huì)意義、倫理價(jià)值、科學(xué)內(nèi)涵。
如果只考慮大數(shù)據(jù)和計(jì)算機(jī)應(yīng)用的優(yōu)勢(shì),忽視其負(fù)面效應(yīng)和局限性,那么大數(shù)據(jù)以及AI將可能失去其科學(xué)與社會(huì)價(jià)值,這也是作者對(duì)“理論先于數(shù)據(jù)”這一科學(xué)方法的有力辯護(hù)。
《錯(cuò)覺》列舉了很多思想性實(shí)驗(yàn)以及案例研究,如圖靈測(cè)試、漢語室思想實(shí)驗(yàn)、威諾格拉德模式挑戰(zhàn)賽等等,這些實(shí)驗(yàn)無不揭示計(jì)算機(jī)本身的思維模仿與學(xué)習(xí)并不是完全超越人類,計(jì)算機(jī)的語言、閱讀和寫作缺乏靈魂、語境。
而計(jì)算機(jī)模型以及數(shù)據(jù)分析結(jié)果無法替代人類的判斷,仍然需要人類充分的討論與批判,完全依賴計(jì)算機(jī)的數(shù)據(jù)結(jié)果將導(dǎo)致很多混亂和錯(cuò)誤的決策。
從理論上來說,計(jì)算機(jī)技術(shù)的演進(jìn)以及大數(shù)據(jù)、人工智能的應(yīng)用的確已從實(shí)驗(yàn)室進(jìn)入到人們的日常生活當(dāng)中,特別是隨著移動(dòng)互聯(lián)網(wǎng)、5G通信技術(shù)的進(jìn)步,計(jì)算機(jī)甚至在某些領(lǐng)域,如計(jì)算能力、學(xué)習(xí)能力、數(shù)據(jù)分析、儲(chǔ)存以及模型預(yù)測(cè)方面超越人類智慧。
數(shù)據(jù)挖掘成為各個(gè)科技公司、高科技企業(yè)、創(chuàng)業(yè)公司的核心競(jìng)爭(zhēng)力,一切產(chǎn)業(yè)發(fā)展都以大數(shù)據(jù)為支撐,而這的確產(chǎn)生了巨大的經(jīng)濟(jì)、社會(huì)效益和廣告宣傳效益?;ヂ?lián)網(wǎng)產(chǎn)業(yè)以及數(shù)字經(jīng)濟(jì)的崛起為大數(shù)據(jù)與人工智能的應(yīng)用提供了廣泛的市場(chǎng),數(shù)據(jù)庫(kù)的泛濫也間接引發(fā)了諸多的爭(zhēng)議,特別是一些購(gòu)物網(wǎng)站、新聞媒體、社交軟件大肆應(yīng)用數(shù)據(jù)挖掘,跟蹤用戶的日常應(yīng)用習(xí)性、消費(fèi)特點(diǎn)和社交網(wǎng)絡(luò),企圖誘導(dǎo)用戶選擇購(gòu)買服務(wù)或訂制某些產(chǎn)品。
值得注意的是,當(dāng)前計(jì)算機(jī)的運(yùn)算能力早已比人類更快,承載的數(shù)據(jù)資源也更為龐大,這些依據(jù)人工智能開發(fā)的應(yīng)用系統(tǒng)已滲透進(jìn)人們的生活,甚至左右人們的思維。如果缺乏對(duì)計(jì)算機(jī)語言以及數(shù)據(jù)分析結(jié)果本身的識(shí)別,將帶來很多消極的結(jié)果。
《錯(cuò)覺》這本書通過一系列數(shù)據(jù)結(jié)果質(zhì)疑計(jì)算機(jī)的“壞數(shù)據(jù)”,而使用數(shù)據(jù)同樣存在較大的“隨機(jī)性”,作者指出,模型不可避免地是由無法解釋的隨機(jī)事件創(chuàng)建出來的,我們應(yīng)該承認(rèn)自己容易受到模型的誘惑。
看似無所不能的計(jì)算機(jī)技術(shù)卻也存在諸多的缺陷,與人類的智慧、思維相比還有很多的局限性。其中,最重要的一點(diǎn),正如作者在文章開篇表明的那樣,計(jì)算機(jī)在批判性思維方面存在嚴(yán)重缺陷。計(jì)算機(jī)在數(shù)據(jù)處理、儲(chǔ)存以及記憶方面的優(yōu)勢(shì)是人類無法匹敵的,隨著計(jì)算機(jī)與人工智能的深度融合,大量的產(chǎn)業(yè)、產(chǎn)品以及思維將受制于計(jì)算機(jī)技術(shù)。
有一點(diǎn)可以明確,現(xiàn)代人們的生活、生產(chǎn)以及創(chuàng)新大都依靠計(jì)算機(jī)模型和數(shù)據(jù)分析,海量的數(shù)據(jù)往往意味著創(chuàng)業(yè)客群與市場(chǎng),而“竊取”這些個(gè)人信息和數(shù)據(jù)漸漸演變?yōu)橐环N產(chǎn)業(yè),行走在法律的邊緣。作者列舉了預(yù)測(cè)總統(tǒng)大選、非線性模型、神經(jīng)網(wǎng)絡(luò)算法等一系列典型的案例,這些“新瓶裝舊酒”的計(jì)算機(jī)數(shù)據(jù)模型看似提供了有力的技術(shù)支撐,為預(yù)測(cè)和分析驗(yàn)證帶來了從未有過的“技術(shù)優(yōu)越性”,卻最終在現(xiàn)實(shí)面前“現(xiàn)形”。
從現(xiàn)實(shí)來看,很多技術(shù)至上論者盲目地認(rèn)為計(jì)算機(jī)語言和數(shù)據(jù)可以“無所不包”,迷信于大數(shù)據(jù),陷入數(shù)據(jù)的誤導(dǎo)與錯(cuò)覺,難以做出理性的決策。如作者在本書第三章總結(jié)道,計(jì)算機(jī)沒有現(xiàn)實(shí)生活認(rèn)知,這些智慧和常識(shí)來自真實(shí)生活。
《錯(cuò)覺》這本書的結(jié)構(gòu)充滿了“批判性”,作者并未采取理論說教、枯燥解讀的傳統(tǒng)模式,而是另辟蹊徑,從科學(xué)實(shí)驗(yàn)、醫(yī)療技術(shù)、歷史政治事件、經(jīng)濟(jì)數(shù)學(xué)模型、股市、保險(xiǎn)等不同角度切入文章主題,以計(jì)算機(jī)數(shù)據(jù)分析的過程、結(jié)果進(jìn)行批判性思考,啟迪讀者去正確認(rèn)知計(jì)算機(jī)語言的邏輯,以及數(shù)據(jù)模型結(jié)果的隨機(jī)性因素。
事實(shí)上,在這本書中,作者提出了很多識(shí)別數(shù)據(jù)和驗(yàn)證數(shù)據(jù)真實(shí)性的方法,一方面是計(jì)算機(jī)語言缺乏時(shí)間性,線性的數(shù)據(jù)分析并不能解釋非線性世界的諸多現(xiàn)象,反而簡(jiǎn)化了現(xiàn)實(shí)世界的復(fù)雜性;另一方面是數(shù)據(jù)本身的缺陷,在計(jì)算機(jī)技術(shù)尚處于開發(fā)階段,人工智能還未成熟,距離人類的思想、批判能力存在較大差距,導(dǎo)致了數(shù)據(jù)的收集、整理和分析并不全面,漏洞百出的數(shù)據(jù)結(jié)果不足以支撐分析的可靠性。近年來,計(jì)算機(jī)與大數(shù)據(jù)也正在通過其廣泛的民意基礎(chǔ)對(duì)政治選舉進(jìn)行“干預(yù)”,網(wǎng)上民調(diào)、互聯(lián)網(wǎng)民意、媒體輿論等,甚至開始進(jìn)入到選舉程序。
人工智能的發(fā)展沒有達(dá)到預(yù)想的效果,是因?yàn)楝F(xiàn)實(shí)生活與歷史事件的復(fù)雜性超越了大數(shù)據(jù)本身的分析,而且眾多的數(shù)據(jù)未能考慮時(shí)間的跨度,模型以及計(jì)算機(jī)語境的符號(hào)不能完全取代人類的批判性思維。
《錯(cuò)覺》這本書的精彩之處正在于此,如馬里蘭大學(xué)法學(xué)教授弗蘭克·帕斯奎爾所評(píng)價(jià)的,本書從計(jì)算機(jī)的角度出發(fā),對(duì)人工智能、大數(shù)據(jù)和機(jī)器學(xué)習(xí)在我們?nèi)粘I钪杏l(fā)盛行的現(xiàn)狀做出了強(qiáng)烈批判。
本書的寫作邏輯與加里·史密斯教授一直以來對(duì)數(shù)據(jù)分析方法的批判性研究一脈相承,其經(jīng)典著作《數(shù)據(jù)科學(xué)的9個(gè)陷阱》《基本統(tǒng)計(jì)、回歸和計(jì)量經(jīng)濟(jì)學(xué)》《標(biāo)準(zhǔn)偏差:有缺陷的假設(shè),扭曲的數(shù)據(jù),以及其他欺騙統(tǒng)計(jì)數(shù)據(jù)的方法》等幾乎都在批判數(shù)據(jù)分析模型和方法,這種思維貫穿于《錯(cuò)覺:AI如何通過數(shù)據(jù)挖掘誤導(dǎo)我們》之中。
本書最后四章的案例論述聚焦于醫(yī)療、股市、日常生活的事例,詳細(xì)分析AI如何通過數(shù)據(jù)挖掘誤導(dǎo)我們。如作者在結(jié)語部分所言,統(tǒng)計(jì)學(xué)證據(jù)不足以辨別真知灼見和虛假信息。只有邏輯、智慧和常識(shí)才能對(duì)其加以區(qū)分。人工智能目前還無法評(píng)估事物是真正相關(guān)還是偶然相關(guān),因?yàn)樗€不理解數(shù)據(jù)的意義。
讀罷此書,也讓我想到了近期一本風(fēng)靡的暢銷書,以色列歷史學(xué)家尤瓦爾·赫拉利的《今日簡(jiǎn)史》,這本跨學(xué)科的經(jīng)典著作提出了富有啟發(fā)性的思考,其中對(duì)人工智能和大數(shù)據(jù)提出了深刻的批判,作者認(rèn)為,我們真正應(yīng)該擔(dān)心的,是有一小群超人類精英憑借算法帶來的力量,與大量底層的手無權(quán)利之人之間發(fā)生沖突。
兩本書有異曲同工之妙,都對(duì)大數(shù)據(jù)、AI人工智能和算法提出了質(zhì)疑,這種批判精神有助于我們對(duì)計(jì)算機(jī)科學(xué)技術(shù)的應(yīng)用保持警惕。對(duì)于普羅大眾來說,正確理解和判斷人工智能、大數(shù)據(jù)的虛假信息、錯(cuò)誤模型著實(shí)比較困難,需要花費(fèi)時(shí)間和精力去辨別,最重要的是能夠形成獨(dú)立的思想判斷力,盡可能不被大數(shù)據(jù)所誤導(dǎo)。
當(dāng)然,本書的出發(fā)點(diǎn)并不是毫無根據(jù)地指責(zé)大數(shù)據(jù)和人工智能的科學(xué)進(jìn)步,而是站在更接近于人性和社會(huì)學(xué)的角度理解AI,這才是真正的科學(xué)精神。加里·史密斯教授最后指出,在大數(shù)據(jù)時(shí)代,真正的危險(xiǎn)部署計(jì)算機(jī)比我們更聰明,而是我們自己也這么認(rèn)為,從而信任計(jì)算機(jī)為我們做出重要決定。
《錯(cuò)覺:AI如何通過數(shù)據(jù)挖掘誤導(dǎo)我們》則給予我們一次反思大數(shù)據(jù)和AI人工智能的機(jī)會(huì)。
聯(lián)系客服