隨著技術(shù)的不斷發(fā)展,技術(shù)的種類越來越多,人們不可能掌握全部的技術(shù),但是技術(shù)對于人們的選擇有了太多太多,這時(shí)候在選擇什么技術(shù)的時(shí)候,人們往往就會陷入迷茫,不知道應(yīng)該選擇什么樣的技術(shù),不清楚自己應(yīng)該從什么技術(shù)下手,甚至說會懷疑技術(shù)的作用,認(rèn)為有些技術(shù)沒有意義,不知道有什么用。今天我們探討一下數(shù)據(jù)科學(xué)領(lǐng)域內(nèi)的技術(shù)存在的意義,分析一下大數(shù)據(jù)分析是否雞肋,在數(shù)據(jù)科學(xué)技術(shù)體系中,最高價(jià)值技術(shù)到底是什么,以及在人工智能領(lǐng)域中反對派的聲音越來越大的時(shí)候,人工智能是否還能走下去,還能走多遠(yuǎn)?
大數(shù)據(jù)分析并不雞肋
在計(jì)算機(jī)誕生的70年后,單臺計(jì)算機(jī)的計(jì)算性能逼近物理極限,伴隨計(jì)算機(jī)發(fā)展的摩爾定律逐漸失效。在這70年的發(fā)展過程中,剛開始是可以用摩爾定律進(jìn)行準(zhǔn)確的描述的,1965年,英特爾創(chuàng)始人之一戈登摩爾在考察計(jì)算機(jī)硬件的發(fā)展規(guī)律后,提出了著名的摩爾定律:
該定律認(rèn)為,同一面積芯片上可容納晶體管的數(shù)量,每隔16-24個(gè)月將翻一倍,計(jì)算性能也將翻一倍。換而言之,也就是每隔16-24個(gè)月,單位價(jià)格可購買到的計(jì)算能力將翻一倍。在隨后的幾十年內(nèi),摩爾定律被無數(shù)次的被印證。而直到現(xiàn)在,計(jì)算機(jī)性能已經(jīng)逼近極限的情況下,摩爾定律似乎已經(jīng)失效了。
發(fā)展的期間伴隨著摩爾定律不斷的生效,在計(jì)算機(jī)方面同步發(fā)展的還有網(wǎng)絡(luò)寬帶和物理的存儲容量,半個(gè)多世紀(jì)以來,存儲器的價(jià)格幾乎下降到原來價(jià)格的億分之一。
而網(wǎng)絡(luò)寬帶的的速度也在不斷的突破極限。
隨著這些物理硬件的升級,計(jì)算機(jī)領(lǐng)域內(nèi)便產(chǎn)生了OTT式的技術(shù)革新,誕生了分布式計(jì)算和量子計(jì)算機(jī)技術(shù),而這兩者的出現(xiàn),也必將決定性的改變計(jì)算機(jī)資源供給端的情況。
分布式計(jì)算機(jī)技術(shù),已經(jīng)逐漸成為大數(shù)據(jù)領(lǐng)域底層IT架構(gòu)的行業(yè)標(biāo)準(zhǔn),分布式計(jì)算可以實(shí)現(xiàn)一個(gè)計(jì)算目標(biāo)可以調(diào)配無限計(jì)算資源并予以支持,解決了大數(shù)據(jù)情境中運(yùn)算量過大、超出單臺物理機(jī)運(yùn)算承受能力極限的問題,并且同物理計(jì)算資源協(xié)同調(diào)配,為后續(xù)的云計(jì)算奠定了基礎(chǔ)??陀^ 的講,分布式計(jì)算機(jī)技術(shù)使計(jì)算資源趨于無限。
而量子計(jì)算機(jī)技術(shù)將使單體計(jì)算能力擁有質(zhì)的飛躍。但是在量子計(jì)算機(jī)核心技術(shù)尚未突破之時(shí),人類面對呈現(xiàn)爆發(fā)式增長的數(shù)據(jù)束手無策….
在經(jīng)過這漫長的探索后,人類現(xiàn)在決定先借助分布式計(jì)算技術(shù)實(shí)現(xiàn)新的一輪OTT式技術(shù)革新,而此舉將不僅解決了海量數(shù)據(jù)存儲與計(jì)算問題,還有希望幫助人類徹底擺脫計(jì)算資源瓶頸的束縛。計(jì)算資源無限,世界將會怎樣….
但是從大數(shù)據(jù)技術(shù)的發(fā)展現(xiàn)狀來看,真正的難點(diǎn)還是在于底層工具的掌握,由于發(fā)展尚處于初級階段,還需要人們掌握大量的底層工具,這條道路因?yàn)樽叩萌松偎圆艜@得泥濘不堪,只有將基礎(chǔ)工具發(fā)展和掌握成熟之后,才可以降低使用者的門檻。
對于我們而言,這條路難么?真的很難!但是是值得我們客服這條路上的困難的,因?yàn)槭找鏁浅5膭澦?,這條路的難處在于要掌握很多底層工具,為什么?因?yàn)樽哌@條路的人少,現(xiàn)在還是一條泥巴路,很難走,但是為什么是值得我們克服困難也要走下去呢,是因?yàn)橹灰孔佑?jì)算機(jī)不出現(xiàn)、隨著摩爾定律的失效、數(shù)據(jù)量還在增加,大量過路的需求會催生一條又一條高速公路,然后鋪路的大公司設(shè)卡收稅,泥巴路遲早會變成高速公路,但只要你先過去,就能看到別人看不到的風(fēng)景。
從計(jì)算機(jī)由DOS系統(tǒng)到桌面系統(tǒng),Python機(jī)器學(xué)習(xí)由源碼到算法庫,不一直都是這樣么。
數(shù)據(jù)革命的本質(zhì)
大數(shù)據(jù)分析技術(shù)有價(jià)值、數(shù)據(jù)分析技術(shù)更有價(jià)值,那整個(gè)數(shù)據(jù)科學(xué)知識內(nèi)容體系中,最有價(jià)值的到底是什么?
如果從發(fā)現(xiàn)技術(shù)的角度看待問題確實(shí)很有意思,那我們不妨再來探討一個(gè)問題,那就是從技術(shù)層面而言(非工作是否好找的角度),數(shù)據(jù)科學(xué)中最有價(jià)值的技術(shù)模塊是哪個(gè)?
人工智能是數(shù)據(jù)養(yǎng)育的智能,其決策的核心是算法,人工智能的發(fā)展與十八世紀(jì)工業(yè)革命通過機(jī)器生產(chǎn)代替手工勞動從而釋放人類的勞動力類似,數(shù)據(jù)智能將通過參與、代替人類決策的方式,釋放人類腦力。而機(jī)器學(xué)習(xí)就是提供人工智能決策的算法核心。
機(jī)器學(xué)習(xí)算法的核心用途是挖掘事物運(yùn)行內(nèi)在邏輯和規(guī)律,就是把數(shù)據(jù)作為接受外部信息形式,用數(shù)據(jù)還原外部事物的基本屬性和運(yùn)行狀態(tài),用機(jī)器學(xué)習(xí)算法對其規(guī)律進(jìn)行挖掘,還原客觀規(guī)律。再應(yīng)用規(guī)律輔助決策。
機(jī)器學(xué)習(xí)可以使得人工智能在人類基礎(chǔ)重復(fù)決策領(lǐng)域代替人類參與決策。
算法的核心方法論,是取法其上,僅得為中,數(shù)據(jù)分析核心價(jià)值要有技術(shù)核心價(jià)值這桿大旗;不管小數(shù)據(jù)還是大數(shù)據(jù),都是重分析。而伴隨著Python的星期,催生出了進(jìn)一步完善的基礎(chǔ)設(shè)施,Python依然成為了標(biāo)準(zhǔn)的工具。
而Python最核心的技能就可以說是利用眾多強(qiáng)大的算法庫進(jìn)行算法建模分析
數(shù)據(jù)、算法、計(jì)算能力這三架馬車所推動的人工智能技術(shù)發(fā)展,是否已經(jīng)遇到了瓶頸
2018年1月我國國家標(biāo)準(zhǔn)化管理委員會頒布的《人工智能標(biāo)準(zhǔn)化白皮書》對人工智能學(xué)科的基本思想和內(nèi)容作出了解釋。認(rèn)為人工智能應(yīng)該是圍繞智能活動而構(gòu)造的人工系統(tǒng),是一項(xiàng)知識的工程,是機(jī)器模仿人類利用知識完成一定行為的過程。
相對來說我國的人工智能的起步還是較晚,人工智能的發(fā)展階段可以分為三個(gè)階段,第一階段是從20世紀(jì)50年代—80年代,在這一階段人工智能剛誕生,但由于很多事物不能形式化表達(dá),建立的模型存在一定的局限性。第二階段是從20世紀(jì)80年代—90年代,專家系統(tǒng)得到快速發(fā)展,數(shù)學(xué)模型有重大突破,但由于專家系統(tǒng)在知識獲取等方面的不足,人工智能的發(fā)展又一次進(jìn)入低谷期。第三階段是從21世紀(jì)初—至今,隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算能力的提升,人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展, 迎來了又一個(gè)繁榮時(shí)期。
根據(jù)人工智能的發(fā)展定義,以及國家頒布的《人工智能白皮書》,人工智能可以分為兩種,強(qiáng)人工智能和弱人工智能。
弱人工智能是并不能真正實(shí)現(xiàn)推理和解決問題的智能機(jī)器,這些機(jī)器表面看像是智能的,但是并不真正擁有智能,也不會有自主意識。但是這仍是目前的主流研究仍然集中于弱人工智能,并取得了顯著進(jìn)步,如語音識別、圖像處理和物體分割、機(jī)器翻譯等方面取得了重大突破,甚至可以接近或超越人類水平。
強(qiáng)人工智能是真正能思維的智能機(jī)器,并且認(rèn)為這樣的機(jī)器是有知覺的和 自我意識的,這類機(jī)器可分為類人與非類人兩大類。從一般意義來說,達(dá)到人類水平的、能夠自適應(yīng)地應(yīng)對外界環(huán)境挑戰(zhàn)的、 具有自我意識的人工智能稱為“通用人工智能”、“強(qiáng)人工智能”或“類人智能”
一般來說,在我們認(rèn)為強(qiáng)人工智能的時(shí)代已經(jīng)來臨,只是尚未流行起來,但這時(shí)候,卻還有一些有意思的觀點(diǎn),他們持反對的聲音,認(rèn)為人工不智能或者說是人工智障。
他們認(rèn)為當(dāng)我們在開車的時(shí)候,大腦在飛速的處理各種信息:交通信號、標(biāo)志物、路面的井蓋、積水;看到馬路中央有一只狗在過馬路時(shí),我們會踩剎車;看到中央有一只鳥,我們會判斷鳥會快速飛走,不用減速;如果是塑料袋,我們可以直接壓過去;如果是大石頭,我們就需要避讓。這些都是我們通過經(jīng)驗(yàn)的累積以及生活常識構(gòu)成的。但是,人工智能卻做不到這些。
目前人們所研究的人工智能是“狹義”人工智能?!罢嬲摹比斯ぶ悄苄枰軌蚶斫馐澄镏g的因果關(guān)系,比如警方在路上設(shè)置的錐標(biāo),哪怕是倒了,或是被壓扁了,也要能夠被識別出來。但目前的圖形識別能力,哪怕是把障礙物換個(gè)角度,計(jì)算機(jī)識別起來都會很困難。而“狹義”人工智能走的是機(jī)器學(xué)習(xí)路線,換句話說,計(jì)算機(jī)會把路上所有物體(包括夠、其他車輛、標(biāo)志物、行人、塑料袋、石頭等)都簡單的看做是障礙物,同時(shí)計(jì)算和預(yù)測這些障礙物的移動路線,判斷是否會和汽車的路線發(fā)生沖突,然后執(zhí)行相應(yīng)的動作。
那么問題來了……
當(dāng)計(jì)算機(jī)無法理解物體的時(shí)候,也就意味著不可能100%準(zhǔn)確預(yù)測物體的移動軌跡。比如,馬路中央的狗。你很難預(yù)測它下一秒的位置,即使它目前正在向前狂奔。如果馬路中央是一個(gè)孩子呢?同時(shí),讓計(jì)算機(jī)識別路邊的交通指示牌也是一件十分困難的事情。當(dāng)指示牌有破損、遮擋物等等,都會影響計(jì)算機(jī)的識別。
所以,目前的人工智能都屬于“狹義”的人工智能,它的核心是基于大數(shù)據(jù)進(jìn)行的學(xué)習(xí)。但在瞬息萬變的現(xiàn)實(shí)世界里,由于計(jì)算機(jī)無法真正理解事物的相互關(guān)系,因此并不能處理出現(xiàn)的意外情況。
我們可以將無人駕駛分為五個(gè)級別:
輔助性自動駕駛(如自動剎車、保持車道、停靠輔助系統(tǒng)等)
滿足一定條件下,汽車可以自動駕駛,但需要駕駛員進(jìn)行實(shí)時(shí)監(jiān)控(如特斯拉的自動駕駛技術(shù))
滿足一定條件下,汽車可以自動駕駛,駕駛員不需要實(shí)時(shí)監(jiān)控,但要隨時(shí)準(zhǔn)備好接管駕駛。
滿足一定條件下,可實(shí)現(xiàn)無人看管的自動駕駛。
完全實(shí)現(xiàn)無人看管的自動駕駛。
就目前來看,我們距離第五個(gè)級別的無人駕駛的距離還有非常遙遠(yuǎn)的一條道路要走,當(dāng)然這條道路的未來,并沒有人會知道是什么樣子的。
在我看來,隨著技術(shù)的發(fā)展,人工智能這條道路并非是走不下去的,只是這條道路比較困難,而且并不是說在人工智能完全達(dá)到強(qiáng)人工智能的時(shí)候才能造福人類,目前人工智能已經(jīng)用于我們身邊的多個(gè)領(lǐng)域,并且在不斷的幫助我們,我們可以通過人工智能不斷的幫助我們完善人工智能,達(dá)成一個(gè)不斷的循環(huán),只是需要很多對數(shù)據(jù)科學(xué)領(lǐng)域感興趣的人,來不斷的完善它們。
希望你看完這篇文章能夠有所收獲,如果有一些想法,希望可以一起討論一下,謝謝。
聯(lián)系客服