產(chǎn)業(yè)智能官
The following article comes from 知識(shí)工場(chǎng) Author 吳強(qiáng)、肖仰華
知識(shí)工場(chǎng)
知識(shí)工場(chǎng)依托復(fù)旦大學(xué)等研究機(jī)構(gòu)專注于各類知識(shí)圖譜構(gòu)建、管理與應(yīng)用理論及關(guān)鍵技術(shù)研究。知識(shí)工場(chǎng)以構(gòu)建能夠滿足機(jī)器語(yǔ)言認(rèn)知需要的大規(guī)模、高質(zhì)量知識(shí)圖譜為基本目標(biāo),并以推進(jìn)知識(shí)圖譜在文本理解、智慧搜索以及機(jī)器智腦等領(lǐng)域中的深入應(yīng)用為主要使命。
原創(chuàng) 吳強(qiáng)、肖仰華 知識(shí)工場(chǎng)
本文節(jié)選自由上海教育出版社出版,任友群教授主編的《人工智能》系列教材高中分冊(cè),《人工智能》(高中分冊(cè))由復(fù)旦大學(xué)附屬中學(xué)吳強(qiáng)老師和復(fù)旦大學(xué)肖仰華教授聯(lián)合主編?,F(xiàn)將引言部分內(nèi)容公開(kāi)征集反饋。本文文字和圖片版權(quán)均歸上海教育出版社所有。本文為原創(chuàng)文章,若需轉(zhuǎn)載,請(qǐng)留言詢問(wèn)。
什么是人工智能
人工智能(Artificial Intelligence,簡(jiǎn)稱“ AI”)自誕生之日 起,其定義與內(nèi)涵就一直存在爭(zhēng)議。從字面上看,AI 由“人 工”和“智能”兩詞構(gòu)成,其核心是智能。因此,人工智能首先 是智能的一種。但是人工智能是人造的,而非自然形成的智能(如我們?nèi)祟惖闹悄芫褪墙?jīng)過(guò)長(zhǎng)期的進(jìn)化而形成的一種生物智能)。進(jìn)一步理解人工智能的關(guān)鍵,在于理解“智能是什么”, 這其實(shí)是一個(gè)難以回答的問(wèn)題。一個(gè)普遍的認(rèn)識(shí)是“智能是利用知識(shí)解決問(wèn)題的能力”。作為“萬(wàn)物之靈長(zhǎng)”的人類,其智能很大程度上就體現(xiàn)在人類能夠發(fā)現(xiàn)知識(shí)并利用知識(shí)解決各類問(wèn) 題。人工智能的研究與實(shí)踐的一個(gè)重要目標(biāo)就是回答“智能是什么”這一問(wèn)題。對(duì)這個(gè)問(wèn)題的回答,將成為我們這代人甚至后面幾代人共同努力的方向與目標(biāo)。
如果需要給人工智能下一個(gè)定義,可以表述為:人工智能是通過(guò)智能機(jī)器延伸、增強(qiáng)人類改造自然和治理社會(huì)能力的科學(xué)與技術(shù)。人工智能首先是一門科學(xué),因?yàn)槲覀冃枰忉屩悄?的本質(zhì),需要回答智能能否計(jì)算、如何計(jì)算等科學(xué)問(wèn)題。人工智能更是一項(xiàng)工程,因?yàn)槲覀冃枰寵C(jī)器實(shí)現(xiàn)對(duì)于人類智能的模擬,從而解決需要人類智能才能解決的問(wèn)題。因此,人工智 能兼有科學(xué)與工程的屬性。也正是這個(gè)原因,決定了人工智能的跨學(xué)科和綜合特性。人工智能涉及哲學(xué)、心理學(xué)、數(shù)學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)等多個(gè)學(xué)科。人工智能的最終目標(biāo)不是發(fā)展自主的機(jī)器智能,而是借助人工智能增強(qiáng)人類認(rèn)識(shí)世界、改造世界的能力。拓展和延伸人類的智能,并最終造福人類社會(huì),是發(fā)展人工智能的根本使命,也是唯一使命。人工智能是以人類智能為模板進(jìn)行拓印與塑形的,理解與模擬人類智能是人工智能實(shí)現(xiàn)的基本路徑。人類智能,外觀體現(xiàn)為行為,內(nèi)察體現(xiàn)為思維。人工智能的研究與實(shí)踐不論其形式如何不同,其最終落腳點(diǎn)要么是讓機(jī)器具備人類身體的智能行為能力,要么是讓機(jī)器具備人類心靈的復(fù)雜思維能力。
人類的智能行為能力體現(xiàn)在其身體的感知與運(yùn)動(dòng)能力。我們的身體具有五官與四肢。我們通過(guò)五官識(shí)音辨聲、識(shí)圖辨形、辨別氣味等,通過(guò)四肢操縱物體、運(yùn)動(dòng)身體,從而實(shí)現(xiàn)身體與環(huán)境的復(fù)雜交互。機(jī)器實(shí)現(xiàn)這些能力需要具備模式識(shí)別與反饋控制能力。比如,為了識(shí)別一個(gè)手寫(xiě)字是不是“0”,機(jī)器必須能夠從手寫(xiě)體輸入數(shù)據(jù)中識(shí)別出“0”所對(duì)應(yīng)的書(shū)寫(xiě)模式。模式識(shí)別能力是我們五官所具備的基本能力。我們?nèi)祟惖乃闹軌蚴秩犴g、靈活地做出各類動(dòng)作,實(shí)現(xiàn)各類物體操縱,這背后體現(xiàn)的是人類四肢與環(huán)境的強(qiáng)大交互能力。比如機(jī)械手臂在抓舉物品時(shí),需要實(shí)時(shí)感知物品的位置以及抓舉的力度,從而及時(shí)調(diào)整抓舉的動(dòng)作與姿態(tài),最終完成抓舉動(dòng)作。近年來(lái),機(jī)器在模式識(shí)別與運(yùn)動(dòng)控制等能力上飛速發(fā)展,已經(jīng)初步達(dá)到人類水平。以感知數(shù)據(jù)中的模式、物理世界的狀態(tài)為主,讓機(jī)器具備人類的智能行為為主要目標(biāo)的人工智能研究和實(shí)踐,我們稱之為“感知派”。
人類的智能更為鮮明地體現(xiàn)在人類的復(fù)雜心智上。人類的心智活動(dòng)十分多樣,包括語(yǔ)言理解、場(chǎng)景理解、調(diào)度規(guī)劃、智能檢索、學(xué)習(xí)歸納、推理決策等。塑造人類心智能力的器官是我 們的大腦。理解大腦的運(yùn)作機(jī)制,從而實(shí)現(xiàn)類腦智能,一直以來(lái)是科學(xué)家們持之以恒為之奮斗的目標(biāo)之一。隨著人工智能的發(fā)展,讓機(jī)器具有一顆聰慧的大腦,已被迫切地提上議事日程。有身無(wú)心的機(jī)器就好比沒(méi)有靈魂的“僵尸”,雖然也能解決很多問(wèn)題,但是難以進(jìn)入人類社會(huì),成為人類有趣的“伙伴”。如 果人工智能的發(fā)展僅是停留在感知與運(yùn)動(dòng)階段,機(jī)器只是達(dá)到了一般動(dòng)物的智能水平,而真正意義上使得人類從動(dòng)物本性中脫胎而出的是人類獨(dú)有的心智能力。雖然動(dòng)物也有大腦,也有 一定的心智水平,但是人類心智與動(dòng)物心智的根本差別在于人類的認(rèn)知能力。認(rèn)知能力是指人腦接受外界信息,經(jīng)過(guò)加工處理,轉(zhuǎn)換成內(nèi)在的心理活動(dòng),從而形成對(duì)世界的認(rèn)知體驗(yàn)的過(guò)程。它包括時(shí)空認(rèn)知、因果認(rèn)知、語(yǔ)言認(rèn)知、文化認(rèn)知等方面。很顯然,目前只有人類具有認(rèn)知能力,以“認(rèn)知”為基礎(chǔ)的人工智能研究和實(shí)踐,被稱為“認(rèn)知派”,將是未來(lái)人工智能研究與實(shí)踐的焦點(diǎn)。
值得注意的是,雖然人類是實(shí)現(xiàn)人工智能的模板,但是人工智能在當(dāng)下的實(shí)踐已經(jīng)不單單以“類人”為目標(biāo),很多時(shí)候是遠(yuǎn)超人類水平的。人類的特定智能很多情況下是有局限的。比如,我們?cè)跊Q定買哪本人工智能教材時(shí),其決策要素一般不超過(guò) 5—7 個(gè),而機(jī)器則可以同時(shí)考慮數(shù)以百萬(wàn)計(jì)的決策要素進(jìn)行判斷。人類感知的物理范圍是十分有限的,而機(jī)器視覺(jué)可 以識(shí)別數(shù)千米范圍內(nèi)的目標(biāo)。因此,在很多單項(xiàng)智能上,人類被機(jī)器超越只是時(shí)間問(wèn)題,如計(jì)算、下棋、識(shí)圖、辨聲等。人工智能的發(fā)展進(jìn)程必定是我們見(jiàn)證人類單項(xiàng)智能被機(jī)器逐步超越 的過(guò)程。但是有一個(gè)至關(guān)重要的獎(jiǎng)項(xiàng),智能的“全能冠軍”,卻是機(jī)器難以從人類手中奪走的。無(wú)數(shù)個(gè)智能的單項(xiàng)冠軍也難以企及這一“全能冠軍”的智能水平。這就引出了人工智能的強(qiáng)弱之分的話題。
人工智能除了有“感知”與“認(rèn)知”之分,亦有“強(qiáng)”“弱”之 分。任何一臺(tái)普通的計(jì)算器在數(shù)值運(yùn)算方面的能力遠(yuǎn)超我們?nèi)祟愖盥斆鞯念^腦,但是不會(huì)有人覺(jué)得他比 3歲的兒童更智能。其背 后的根本原因在于,計(jì)算器只能勝任數(shù)值計(jì)算這一單項(xiàng)任務(wù),而 3歲兒童卻能勝任幾乎無(wú)法窮舉的任務(wù),如識(shí)別父母、尋找奶瓶、 辨別聲音等。因此,智能的強(qiáng)弱很大程度上體現(xiàn)在其通用或單一的程度。強(qiáng)的智能是能夠勝任任何任務(wù)求解所需要的智能,而弱的智能僅限于解決某個(gè)特定任務(wù),強(qiáng)人工智能的實(shí)現(xiàn)顯然遠(yuǎn)遠(yuǎn)難于弱人工智能。當(dāng)前取得實(shí)際應(yīng)用效果的仍以弱人工智能為主。實(shí)現(xiàn)強(qiáng)人工智能任重道遠(yuǎn),但卻不可回避。因?yàn)閺?qiáng)人工智能解決 的是人工智能的根本難題:現(xiàn)實(shí)世界的開(kāi)放性?,F(xiàn)實(shí)世界是復(fù)雜的,真實(shí)任務(wù)是多樣的,而我們的計(jì)算機(jī)當(dāng)前只能勝任預(yù)定義的任務(wù)與場(chǎng)景,一旦碰到從未見(jiàn)過(guò)的案例、樣本、場(chǎng)景,就顯得無(wú)能為力。努力提升機(jī)器智能的適應(yīng)性,以及對(duì)于開(kāi)放性的應(yīng)對(duì)能力,已經(jīng)成為人工智能最為重要的研究課題之一。
值得注意的是,人工智能仍然是個(gè)不斷發(fā)展中的學(xué)科,其內(nèi)涵仍在不斷豐富與完善,一些新的研究視角在為人工智能持續(xù)增添新的內(nèi)涵,如 AI 的安全性與可控性、AI 的黑盒化與可解釋、AI 與人文學(xué)科、AI 與社會(huì)發(fā)展、AI 與腦科學(xué)等,這些新的研究視角在持續(xù)推動(dòng) AI 概念的發(fā)展與完善。
人工智能發(fā)展的歷程
“理想很豐滿,現(xiàn)實(shí)很骨感”,“柳暗花明又一村”,用這兩句話來(lái)表達(dá)人工智能的發(fā)展歷程是再恰當(dāng)不過(guò)的了。縱觀人工智能的發(fā)展歷程,大體可分為三次高潮和兩個(gè)低谷期。
1.? 人工智能發(fā)展的第一次高潮
20 世紀(jì) 40 至 50 年代,來(lái)自不同領(lǐng)域的一批科學(xué)家開(kāi) 始探討制造人工大腦的可能性,這是人工智能問(wèn)題的雛形。1943 年,美國(guó)麻省理工學(xué)院的兩位科學(xué)家沃倫·麥卡洛克 (Warren McCulloch)和沃爾特·皮茨( Walter Pitts)提出了一種生物神經(jīng)元的數(shù)學(xué)模型,使得利用計(jì)算機(jī)模擬的人工神經(jīng)元成為可能。多個(gè)人工神經(jīng)元連接在一起可以形成一個(gè)類 似生物神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)(參見(jiàn)圖引 -1)。1957 年,弗蘭克·羅森勃拉特(Frank Rosenblatt)提出了感知器模型,將神經(jīng)網(wǎng)絡(luò)研究推向工程實(shí)現(xiàn)。
1950 年,英國(guó)計(jì)算機(jī)專家艾倫·圖靈( Alan Turing)提出了著名的圖靈測(cè)試,用來(lái)判斷一臺(tái)機(jī)器是否具有人類智能。它更像一場(chǎng)有趣的“模仿游戲”:由測(cè)試者向被測(cè)試者提出多個(gè)問(wèn) 題,根據(jù)被測(cè)試者的回答判斷被測(cè)試者是人還是機(jī)器。如果有超過(guò) 30% 的測(cè)試者不能確定被測(cè)試者是人還是機(jī)器,那么就可以說(shuō)這臺(tái)機(jī)器具有人類智能(參見(jiàn)圖引 -2)。由于圖靈測(cè)試只能測(cè)試機(jī)器是否具有智能的外在表現(xiàn),隨著人工智能的發(fā)展,它日益暴露出局限性。設(shè)想一下, 如果將對(duì)話任務(wù)換成下圍棋,我們現(xiàn)在顯然無(wú)法再根據(jù)機(jī)器的圍棋水平來(lái)判斷對(duì)方是人還是機(jī)器。因?yàn)楸娝苤?,機(jī)器在圍棋游戲方面已經(jīng)遠(yuǎn)超人類冠軍水平。隨著機(jī)器語(yǔ)音和對(duì)話能力的提升,我們也越來(lái)越難以判斷為你服務(wù)的電話客服到底是機(jī)器還是人類。
1956 年,在美國(guó)漢諾威小鎮(zhèn)的達(dá)特茅斯學(xué)院召開(kāi)的一次研討會(huì)上,一批各有所長(zhǎng)的科學(xué)家聚在一起,討論著一個(gè)當(dāng)時(shí)被認(rèn)為不切實(shí)際的主題——讓逐漸成熟的計(jì)算機(jī)代替人類解決一些感知、認(rèn)知乃至決策的問(wèn)題。會(huì)議整整開(kāi)了 2 個(gè)月,科學(xué)家們各執(zhí)一詞,誰(shuí)都說(shuō)服不了誰(shuí),最后有人提出了“人工智能”的說(shuō)法。這次會(huì)議被公認(rèn)為人工智能誕生的標(biāo)志。同年,人工智能被確立為一門學(xué)科。
這一新興學(xué)科的產(chǎn)生,很快就引起學(xué)術(shù)界的廣泛關(guān)注,研究者紛至沓來(lái),新課題層出不窮。從 20 世紀(jì) 50 年代后期到 60 年代,涌現(xiàn)出了一大批成功的 AI 程序和新的研究方向。有人 開(kāi)發(fā)了程序 STUDENT,它能夠解決高中程度的代數(shù)應(yīng)用題, 被認(rèn)為是人工智能在自然語(yǔ)言處理領(lǐng)域早期的應(yīng)用成果。有人創(chuàng)建了全世界最早的聊天機(jī)器人 ELIZA,它可以使用英語(yǔ)和用戶交流。ELIZA 是一個(gè)早期的自然語(yǔ)言處理程序,它通過(guò)模式匹配和替代的方式來(lái)實(shí)現(xiàn)人機(jī)對(duì)話(其實(shí)只是按固定套路作答,機(jī)器并不理解語(yǔ)言的意義,實(shí)際上距離真正的人工智能還有很長(zhǎng)的距離要走)。
20 世紀(jì) 60 年代中期,人工智能研究在資金方面得到了大量資助,并且在世界各地建立了實(shí)驗(yàn)室。當(dāng)時(shí)人工智能的研究人員們對(duì)未來(lái)充滿信心,著名的科學(xué)家赫伯特·西蒙( Herbert Simon)甚至預(yù)言:“機(jī)器將能夠在20 年內(nèi)完成人類可以做的任何工作?!边€有的科學(xué)家認(rèn)為“在一代人之內(nèi)……創(chuàng)造‘人工智能’的問(wèn)題將基本解決”。人工智能研究迎來(lái)了第一個(gè)“黃金”發(fā)展時(shí)期。
然而,現(xiàn)實(shí)并不像人們預(yù)期的那樣樂(lè)觀,人工智能的發(fā)展遭遇了瓶頸。主要的原因是:當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算能力和數(shù)據(jù)處理能力較低,數(shù)據(jù)也相對(duì)匱乏,不能滿足解決復(fù)雜問(wèn)題的需要。人工智能步入第一次低谷期。
2.? 人工智能發(fā)展的第二次高潮
進(jìn)入 20 世紀(jì) 80 年代早期后,隨著新興的工業(yè)、商業(yè)、金融等行業(yè)的發(fā)展,人工智能研究作為附屬于其他行業(yè)的輔助性手段與工具得到了一定的恢復(fù)。
這一時(shí)期比較有代表性的研究進(jìn)展包括:
一是“專家系統(tǒng)”的出現(xiàn)。這是一種模擬人類專家知識(shí)和分析技能的人工智能系統(tǒng), 通過(guò)知識(shí)表示和知識(shí)推理技術(shù),來(lái)模擬領(lǐng)域?qū)<医鉀Q問(wèn)題的過(guò)程。專家系統(tǒng)以知識(shí)庫(kù)和推理機(jī)為核心,利用知識(shí)得到一個(gè)滿意的解是系統(tǒng)的求解目標(biāo)。著名的專家系統(tǒng)包括:ExSys( 第一 個(gè)商用的專家系統(tǒng) )、Mycin(一個(gè)診斷系統(tǒng))等。
二是神經(jīng)網(wǎng)絡(luò)模型的再次興起。大衛(wèi)·魯姆哈特(David Rumelhart)等人于 20 世紀(jì) 80 年代提出的多層感知器及反向傳播算法,優(yōu)化了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法。
這一時(shí)期比較有影響力的人工智能應(yīng)用是日本的“第五代計(jì)算機(jī)項(xiàng)目”。20 世紀(jì) 80 年代,日本提出了“第五代計(jì)算機(jī)項(xiàng)目”。它的主要目標(biāo)之一是突破所謂的“馮·諾依曼瓶頸” (馮·諾依曼架構(gòu)是以存儲(chǔ)程序?yàn)楹诵乃枷氲闹髁饔?jì)算機(jī)體系結(jié)構(gòu),當(dāng)時(shí)的日本學(xué)者認(rèn)為這一體系結(jié)構(gòu)只能實(shí)現(xiàn)有限的運(yùn)算和信息處理,因此稱之為“馮·諾依曼瓶頸”),實(shí)現(xiàn)具有推理以及知識(shí)處理能力的人工智能計(jì)算機(jī)。在第五代計(jì)算機(jī)項(xiàng)目的激勵(lì)下,人工智能領(lǐng)域的研究項(xiàng)目得到推進(jìn)。1985 年,人工智能市場(chǎng)規(guī)模已超過(guò)十億美元。
然而,好景不長(zhǎng)。受限于當(dāng)時(shí)有限的數(shù)據(jù)和算力,機(jī)器仍然難以應(yīng)對(duì)復(fù)雜情形。比如,專家系統(tǒng)中的 if-then 規(guī)則在描述復(fù)雜問(wèn)題時(shí)呈指數(shù)增長(zhǎng),有限的算力難以支撐這類復(fù)雜問(wèn)題的 解決。從 1987 年 Lisp(人工智能程序設(shè)計(jì)的主要語(yǔ)言)機(jī)市場(chǎng)崩潰開(kāi)始,人們對(duì)專家系統(tǒng)和人工智能失去信任,人工智能進(jìn)入第二次低谷期。
3.? 人工智能發(fā)展的第三次高潮
始于 20 世紀(jì) 90 年代末和本世紀(jì)初,人工智能再一次悄然崛起。2006 年,加拿大多倫多大學(xué)的杰弗里·辛頓( Geoffrey Hinton)教授及其學(xué)生提出了深度學(xué)習(xí),并迅速在圖像識(shí)別、語(yǔ)音識(shí)別、游戲和搜索引擎等領(lǐng)域獲得顯著效果。除了以深度學(xué)習(xí)為代表算法的這一原因之外,這一階段的成功還得益于計(jì)算機(jī)計(jì)算能力的提升以及各行各業(yè)海量數(shù)據(jù)的累積。
這一波人工智能浪潮仍在發(fā)展,已發(fā)生的比較具有代表性的事件有:
一是計(jì)算機(jī)與人類的棋壇博弈。1997年 5 月 11 日,深藍(lán)成為第一個(gè)擊敗衛(wèi)冕國(guó)際象棋世界冠軍加里·卡斯帕羅夫的計(jì)算機(jī)國(guó)際象棋系統(tǒng)。2016 年 3 月,阿爾法圍棋( AlphaGo)以 4∶1 擊敗李世石,成為第一個(gè)擊敗職業(yè)圍棋世界冠軍的電腦圍棋程序。2017 年 5 月,阿爾法圍棋在中國(guó)烏鎮(zhèn)圍棋峰會(huì)的三局比賽中,擊敗了當(dāng)時(shí)世界排名第一的中國(guó)棋手柯潔。在這個(gè)基礎(chǔ)上,經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練后,阿法元 (AlphaGoZero)無(wú)需人類經(jīng)驗(yàn),通過(guò)自我博弈,以100∶0 擊敗阿爾法圍棋。
二是機(jī)器在圖像識(shí)別與語(yǔ)音識(shí)別等任務(wù)中達(dá)到人類水平。圖像處理任務(wù)中的錯(cuò)誤率自 2011 年以來(lái)顯著下降。在計(jì)算機(jī)視覺(jué)領(lǐng)域,如手寫(xiě)數(shù)字體識(shí)別數(shù)據(jù)集上,神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率已 經(jīng)超過(guò)人類的平均準(zhǔn)確率。在語(yǔ)音識(shí)別方面,科大訊飛等公司的語(yǔ)音識(shí)別率高達(dá) 98%(2018 年的水平),語(yǔ)音識(shí)別水平在 2016 年就已經(jīng)達(dá)到了人類水平。
三是機(jī)器在語(yǔ)言理解等相關(guān)任務(wù)上取得長(zhǎng)足的進(jìn)步。讓機(jī)器具備理解人類自然語(yǔ)言的能力是人工智能發(fā)展歷程中具有里程碑意義的任務(wù)。更有專家認(rèn)為,語(yǔ)言理解是人工智能桂冠上 的明珠。近年來(lái),得益于深度學(xué)習(xí)模型和大規(guī)模語(yǔ)料,機(jī)器在一系列語(yǔ)言理解任務(wù)中攻城略地。比如在斯坦福問(wèn)答數(shù)據(jù)集 (Stanford Question Answering Dataset,簡(jiǎn)稱“ SQuAD”)文本理解挑戰(zhàn)賽上,早在 2018 年年初,來(lái)自阿里的研究團(tuán)隊(duì)所提出的機(jī)器閱讀理解模型就取得超過(guò)人類水平的準(zhǔn)確率。在2018 年的谷歌 I/O 大會(huì)上,谷歌展示了一段谷歌助理(谷歌的一個(gè)應(yīng)用軟件)與人類長(zhǎng)達(dá)數(shù)分鐘的電話,現(xiàn)場(chǎng)觀眾幾乎無(wú)法分辨出誰(shuí)是機(jī)器,誰(shuí)是人類。此后,各類客服電話大量由機(jī)器代替, 智能客服的成功應(yīng)用大幅降低了人工客服成本。
這些事件的發(fā)生,讓人們充分認(rèn)識(shí)到人工智能技術(shù)所蘊(yùn)含的經(jīng)濟(jì)價(jià)值與社會(huì)潛能。人們對(duì)人工智能技術(shù)的認(rèn)識(shí)由此上升到了一個(gè)前所未有的高度,從而極大地推動(dòng)了人工智能技術(shù)的發(fā)展。
人工智能研究的不同視角
人工智能是個(gè)龐雜的學(xué)科,不同的視角對(duì)人工智能的理解不盡相同。讓我們來(lái)了解一下人工智能研究中主要學(xué)術(shù)流派的看法吧!
1.? 符號(hào)主義流派是這樣認(rèn)為的
符號(hào)主義流派認(rèn)為人工智能源于數(shù)理邏輯,又稱“邏輯主義流派”。數(shù)理邏輯從 19 世紀(jì)末起獲得迅速發(fā)展,到 20 世紀(jì) 30 年代開(kāi)始用于描述智能行為。計(jì)算機(jī)出現(xiàn)后,又在計(jì)算機(jī)上 實(shí)現(xiàn)了邏輯演繹系統(tǒng),其代表性成果為啟發(fā)式程序 LT(邏輯 理論家),證明了 38 條數(shù)學(xué)定理,表明應(yīng)用計(jì)算機(jī)研究人的思維過(guò)程,可以模擬人類智能活動(dòng)。
符號(hào)主義認(rèn)為人類的認(rèn)知過(guò)程是符號(hào)操作與運(yùn)算的過(guò)程, 主張用公理和邏輯體系搭建一套人工智能系統(tǒng)。符號(hào)主義認(rèn)為,知識(shí)表示、知識(shí)推理和知識(shí)應(yīng)用是人工智能的核心。知識(shí) 可以用符號(hào)來(lái)表示,認(rèn)知是符號(hào)加工的過(guò)程,推理是使用理智從某些前提產(chǎn)生結(jié)論的行動(dòng)。符號(hào)主義者致力于用計(jì)算機(jī)的符號(hào)操作來(lái)模擬人的認(rèn)知過(guò)程,其實(shí)質(zhì)就是模擬人的左腦抽象邏 輯思維。符號(hào)主義者最早采用了“人工智能”這個(gè)術(shù)語(yǔ),后來(lái)又發(fā)展了專家系統(tǒng)、知識(shí)工程理論與技術(shù),并在20 世紀(jì) 80 年代取得了很大發(fā)展。
符號(hào)主義流派曾長(zhǎng)期一枝獨(dú)秀,為人工智能的發(fā)展作出重要貢獻(xiàn),尤其是專家系統(tǒng)的成功開(kāi)發(fā)與應(yīng)用,為人工智能走向工程應(yīng)用、實(shí)現(xiàn)理論聯(lián)系實(shí)際具有重要意義。在人工智能的其 他學(xué)派出現(xiàn)之后,符號(hào)主義仍然是人工智能的主流學(xué)派之一。
2.? 聯(lián)結(jié)主義流派是這樣認(rèn)為的
聯(lián)結(jié)主義學(xué)派,又稱“仿生學(xué)派”或“生理學(xué)派”,其主要關(guān)注神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)絡(luò)間的聯(lián)結(jié)機(jī)制和學(xué)習(xí)算法。聯(lián)結(jié)主義認(rèn)為,人工智能源于仿生學(xué),特別是人腦模型的研究。聯(lián)結(jié)主義從神經(jīng)元開(kāi)始,進(jìn)而研究神經(jīng)網(wǎng)絡(luò)模型和腦模型,開(kāi)辟了人工智能的又一發(fā)展道路。聯(lián)結(jié)主義學(xué)派從神經(jīng)生理學(xué)和認(rèn)知科學(xué)的研究成果出發(fā),把人的智能歸結(jié)為人腦的高層活動(dòng)的結(jié)果,強(qiáng)調(diào)智能活動(dòng)是由大量簡(jiǎn)單的單元通過(guò)復(fù)雜的相互聯(lián)結(jié)后并行運(yùn)行的結(jié)果,其中人工神經(jīng)網(wǎng)絡(luò)就是其代表性技術(shù)。
聯(lián)結(jié)主義發(fā)端于 1943 年,誕生了生物神經(jīng)元的計(jì)算模型“ M-P 模型”,其后經(jīng)歷了 1957 年“感知器”模型,1982 年 Hopfield 模型以及 1986 年提出的反向傳播算法等代表性事件。聯(lián)結(jié)主義在近期的代表性進(jìn)展就是深度學(xué)習(xí)。2012 年,在 ImageNet 大型視覺(jué)識(shí)別挑戰(zhàn)賽中,深度學(xué)習(xí)模型以絕對(duì)領(lǐng)先的成績(jī)拔得頭籌。隨著硬件技術(shù)的發(fā)展,深度學(xué)習(xí)成為當(dāng)下實(shí)現(xiàn)人工智能的主流技術(shù)之一。
符號(hào)主義與聯(lián)結(jié)主義的發(fā)展呈現(xiàn)出此起彼落的態(tài)勢(shì)。事實(shí)上,兩者各有其價(jià)值與意義,對(duì)于人工智能的發(fā)展都是不可或缺的,應(yīng)該協(xié)同并進(jìn)、共同促進(jìn)人工智能的發(fā)展。符號(hào)主義從宏觀上(人類的思維過(guò)程)模擬人類的認(rèn)知過(guò)程,而聯(lián)結(jié)主義則從微觀上(神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù))實(shí)現(xiàn)對(duì)于人腦功能的模擬。從當(dāng)前人工智能發(fā)展趨勢(shì)來(lái)看,由聯(lián)結(jié)主義實(shí)現(xiàn)模式識(shí)別等初步感知任務(wù),進(jìn)而將相關(guān)結(jié)果輸入符號(hào)主義的相關(guān)系統(tǒng)中,實(shí)現(xiàn)深度的推理與解釋,是未來(lái)人工智能發(fā)展的基本模式。
3.? 行為主義流派是這樣認(rèn)為的
行為主義流派,又稱“進(jìn)化主義流派”或“控制論學(xué)派”。行為主義流派認(rèn)為人工智能源于控制論,研究?jī)?nèi)容包括生命現(xiàn)象的仿生系統(tǒng)、人工建模與仿真、進(jìn)化動(dòng)力學(xué)、人工生命的計(jì)算理論、進(jìn)化與學(xué)習(xí)綜合系統(tǒng)以及人工生命的應(yīng)用等。行為主義認(rèn)為,人工智能可以像人類智能一樣逐步進(jìn)化,智能體的智能行為只能通過(guò)其與現(xiàn)實(shí)世界及周圍環(huán)境的交互而表現(xiàn)出來(lái)。
控制論思想早在 20 世紀(jì)四五十年代就成為時(shí)代思潮的重要部分,影響了早期的人工智能研究者。美國(guó)數(shù)學(xué)家諾伯特·維納( Norbert Wiener)等人提出的控制論和自組織系統(tǒng)以及我國(guó)科學(xué)家錢學(xué)森等人提出的工程控制論和生物控制論,影響了許多領(lǐng)域。早期的研究工作重點(diǎn)是模擬人在控制過(guò)程中的智能行為和作用,如對(duì)自尋優(yōu)、自適應(yīng)、自校正、自鎮(zhèn)定、自組織和自學(xué)習(xí)等控制論系統(tǒng)的研究,并進(jìn)行“控制論動(dòng)物”的研制。到 20 世紀(jì)六七十年代,上述這些控制論系統(tǒng)的研究取得一定進(jìn)展,播下智能控制和智能機(jī)器人的種子,并在八十年代誕生了智能控制和智能機(jī)器人系統(tǒng)。
直到 20 世紀(jì)末,行為主義流派才以人工智能新學(xué)派的面孔出現(xiàn),引起許多人的關(guān)注。這一學(xué)派的代表作首推美國(guó)麻省理工學(xué)院的羅德尼·布魯克斯 (Rodney Brooks) 所研發(fā)的六足行走機(jī)器人, 它被看作新一代的“控制論動(dòng)物”,是一個(gè)基于感知—?jiǎng)幼髂J降哪M昆蟲(chóng)行為的控制系統(tǒng)。事實(shí)上,這種通過(guò)與環(huán)境自適應(yīng)交互所形成的智能,是一種“沒(méi)有推理的智能”。近期,在深度強(qiáng)化學(xué)習(xí)等技術(shù)的推動(dòng)下,機(jī)器人的環(huán)境交互能力得到顯著提升,能跑會(huì)跳、滿世界“溜達(dá)”的機(jī)器人已經(jīng)逐步變成現(xiàn)實(shí)。
人工智能三要素
人工智能在近期的飛速發(fā)展,主要得益于數(shù)據(jù)的快速積累、計(jì)算能力的不斷提升以及算法的改進(jìn)優(yōu)化。因此,人們把數(shù)據(jù)、算力和算法稱為人工智能三要素。
1.? 人工智能與大數(shù)據(jù)
什么是大數(shù)據(jù)?一般地說(shuō),大數(shù)據(jù)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu) 化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)一般具有大量(Volume)、高速( Velocity)、多樣(Variety)、低價(jià)值密度(Value)、真實(shí)性( Veracity)五個(gè)特點(diǎn),也 稱其為大數(shù)據(jù)的 5V 特點(diǎn)?!按罅俊敝笖?shù)據(jù)體量極大,數(shù)據(jù)量從 TB 級(jí)別到 PB 級(jí)別;“高速”指數(shù)據(jù)產(chǎn)生和處理的速度非常快, 如工業(yè)大數(shù)據(jù)應(yīng)用中部署的各種傳感器能夠以每秒數(shù)個(gè) G 的采集頻率采集數(shù)據(jù);“多樣”指數(shù)據(jù)類型很多,如語(yǔ)音、文字、 圖片和視頻等,不同類型的數(shù)據(jù)往往需要不同的處理手段;“低價(jià)值密度”指大量的數(shù)據(jù)中有價(jià)值的只有極少數(shù),如監(jiān)控視頻中最有價(jià)值的數(shù)據(jù)往往只有幾秒;“真實(shí)性”指追求高質(zhì)量的數(shù)據(jù),因?yàn)閿?shù)據(jù)的規(guī)模并不能為決策提供幫助,數(shù)據(jù)的真實(shí)性和質(zhì)量才是制定正確決策的關(guān)鍵。
大數(shù)據(jù)在現(xiàn)實(shí)的生產(chǎn)與生活中有著大量的實(shí)際應(yīng)用。例如,天氣預(yù)報(bào)就是基于大數(shù)據(jù)而對(duì)未來(lái)天氣作出的預(yù)測(cè)。這些數(shù)據(jù)可以是一年前的,也可以是幾年、幾十年甚至更長(zhǎng)時(shí)間的數(shù)據(jù)積累。又如,在智能商業(yè)、工業(yè) 4.0、互聯(lián)網(wǎng)服務(wù)、智慧金融等領(lǐng)域,大數(shù)據(jù)的運(yùn)用使得這些領(lǐng)域發(fā)生了翻天覆地的變化和進(jìn)步。
大數(shù)據(jù)所具有的海量數(shù)據(jù)的特質(zhì)促進(jìn)了計(jì)算機(jī)科學(xué)、信息科學(xué)、統(tǒng)計(jì)學(xué)等應(yīng)用學(xué)科的飛速發(fā)展。與此同時(shí), 隨著數(shù)據(jù)量的爆炸式增長(zhǎng),非結(jié)構(gòu)化的數(shù)據(jù)和殘缺的數(shù)據(jù)也隨之增加,用傳統(tǒng)的方式處理大數(shù)據(jù)會(huì)極大地?fù)p失數(shù)據(jù)中蘊(yùn)含的價(jià)值。
當(dāng)前,人工智能的發(fā)展集中體現(xiàn)在機(jī)器學(xué)習(xí)上。機(jī)器學(xué)習(xí)的兩種重要方式——監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)——均需要大數(shù)據(jù)的“喂養(yǎng)”。監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的有效手段之一。監(jiān)督學(xué)習(xí) 過(guò)程中需要把有標(biāo)注的樣本“喂”給機(jī)器,而有標(biāo)注的樣本來(lái)自大數(shù)據(jù),從這個(gè)意義來(lái)看,人工智能需要大數(shù)據(jù)。以深度學(xué)習(xí)為例,數(shù)據(jù)量越多,效果就越好。無(wú)監(jiān)督學(xué)習(xí)則從海量數(shù)據(jù) 中學(xué)習(xí)統(tǒng)計(jì)模式來(lái)解決問(wèn)題,同樣離不開(kāi)大數(shù)據(jù)。
那么,是否數(shù)據(jù)越多,是否有標(biāo) 注的樣本越多,效果就越好呢?有學(xué)者在圖像的目標(biāo)檢測(cè)任務(wù)上進(jìn)行了相關(guān)研究(參見(jiàn)圖引 -4),得到的結(jié)論是:一方面,隨著訓(xùn)練數(shù)據(jù)的擴(kuò)展,任務(wù)性能呈對(duì)數(shù)增長(zhǎng),即使訓(xùn)練 圖片規(guī)模達(dá)到 3 億張,性能的上升 也沒(méi)有出現(xiàn)停滯;而另一方面,對(duì)數(shù)增長(zhǎng)也意味著當(dāng)數(shù)據(jù)量達(dá)到一定程度后,模型性能的提升效果就不再顯著。
當(dāng)前人工智能發(fā)展的另一個(gè)重要體現(xiàn)是大規(guī)模知識(shí)工程技術(shù)。知識(shí)工程是以構(gòu)建專家系統(tǒng)為核心內(nèi)容的學(xué)科,旨在利用專家知識(shí)解決問(wèn)題。進(jìn)入互聯(lián)網(wǎng)時(shí)代之后,大規(guī)模開(kāi)放性應(yīng)用需要大規(guī)模的簡(jiǎn)單知識(shí)表示。知識(shí)圖譜就是這樣的知識(shí)表示,其本質(zhì)是一個(gè)大規(guī)模語(yǔ)義網(wǎng)絡(luò),包含實(shí)體、概念及其之間的各類語(yǔ)義關(guān)系。
知識(shí)圖譜的誕生使得知識(shí)工程邁入了大數(shù)據(jù)時(shí)代。傳統(tǒng)工程依賴專家進(jìn)行知識(shí)獲取所導(dǎo)致的瓶頸被突破了,前所未有的算力、算法和數(shù)據(jù)的“匯聚”,使得大規(guī)模自動(dòng)化知識(shí)獲取成為可能。從互聯(lián)網(wǎng)數(shù)十億文本當(dāng)中,利用自動(dòng)抽取模型,可以自動(dòng)獲取數(shù)億計(jì)的結(jié)構(gòu)化知識(shí)?;ヂ?lián)網(wǎng)時(shí)代的高質(zhì)量UGC(用戶貢獻(xiàn)內(nèi)容),比如問(wèn)答、論壇、維基等為自動(dòng)化知識(shí)獲取提供了大量?jī)?yōu)質(zhì)的數(shù)據(jù)來(lái)源。與大數(shù)據(jù)共生的眾包平臺(tái),使得我們可以更有效地利用閑散的人力資源。正是在這些機(jī)會(huì)的合力作用下,人類從小規(guī)模知識(shí)時(shí)代邁進(jìn)了大規(guī)模知識(shí)時(shí)代。知識(shí)圖譜有望引領(lǐng)知識(shí)工程的復(fù)興。更多的知識(shí)表示形式會(huì)在大數(shù)據(jù)的賦能下,解決更多的實(shí)際問(wèn)題(參見(jiàn)圖引 -5,這是與一位足球明星有關(guān)的知識(shí)圖譜)。
人工智能的第三次發(fā)展浪潮很大程度上是由大數(shù)據(jù)推動(dòng)的,沒(méi)有大數(shù)據(jù)的滋養(yǎng),人工智能很難在當(dāng)下取得突飛猛進(jìn)的進(jìn)步。當(dāng)前人工智能的很多成功應(yīng)用都發(fā)生在數(shù)據(jù)豐富的場(chǎng)景,如圖像識(shí)別在準(zhǔn)確率上的突破得益于大量普及的攝像頭所采集的海量圖像數(shù)據(jù)等。
2.? 人工智能與算力
算力即計(jì)算能力。算力的顯著增長(zhǎng),體現(xiàn)在計(jì)算機(jī)的數(shù)據(jù)存儲(chǔ)容量和數(shù)據(jù)處理速度的快速提升(參見(jiàn)圖引 -6、圖 引 -7),均呈現(xiàn)出指數(shù)增長(zhǎng)的趨勢(shì)。我國(guó)的超級(jí)計(jì)算機(jī)“神威·太湖之光”的持續(xù)性能為 9.3 億億次 / 秒,峰值性能可以達(dá)到 12.5 億億次 / 秒。算力的快速增長(zhǎng),一方面是由于摩爾定律 (計(jì)算機(jī)硬件每隔一段時(shí)間便會(huì)翻倍升級(jí))持續(xù)發(fā)揮作用,使得單體計(jì)算元器件的計(jì)算性能在增長(zhǎng)。另一方面,以云計(jì)算為代表的性能擴(kuò)容等技術(shù)也在持續(xù)發(fā)展。云計(jì)算能夠?qū)⒋笠?guī)模廉價(jià)機(jī)器組織成高性能計(jì)算集群,提供匹配甚至遠(yuǎn)超大型機(jī)的計(jì)算能力。
人工智能的飛速發(fā)展離不開(kāi)強(qiáng)大的算力。在人工智能概念剛剛被提出的時(shí)候,由于其計(jì)算能力的受限,當(dāng)時(shí)并不能完成大規(guī)模并行計(jì)算與處理,人工智能系統(tǒng)能力比較薄弱。但是隨 著深度學(xué)習(xí)的流行,人工智能技術(shù)的發(fā)展對(duì)高性能算力提出了日益迫切的需求。深度學(xué)習(xí)主要以深度神經(jīng)網(wǎng)絡(luò)模型為學(xué)習(xí)模型,深度神經(jīng)網(wǎng)絡(luò)是從淺層神經(jīng)網(wǎng)絡(luò)發(fā)展而來(lái)的。深度學(xué)習(xí)模 型的訓(xùn)練是個(gè)典型的高維參數(shù)優(yōu)化問(wèn)題。深度神經(jīng)網(wǎng)絡(luò)模型具有多層結(jié)構(gòu),這種多層結(jié)構(gòu)帶來(lái)了參數(shù)的指數(shù)增長(zhǎng)。以 BERT(Bidirectional Encoder Representation from Transformers)為代表的語(yǔ)言模型多達(dá) 3 億參數(shù),最新的世界紀(jì)錄是 Nvidia 訓(xùn)練出包含 83 億參數(shù)的語(yǔ)言模型(2019年 8 月)。以 BERT 的 3 億 參數(shù)的模型訓(xùn)練為例,研發(fā)團(tuán)隊(duì)共消耗了 16 塊云 TPU(張量 處理單元)近 4 天時(shí)間才能訓(xùn)練完成,其中每塊云 TPU 能提供 180 TFLOPs(1 TFLOPs 意味著每秒 1 萬(wàn)億次的浮點(diǎn)運(yùn)算能力) 算力和 64GB 內(nèi)存。
國(guó)家間的人工智能之爭(zhēng)已經(jīng)在很大程度上演變?yōu)樗懔χ?爭(zhēng)。華為公司推出的一系列 AI 計(jì)算芯片在一定程度上推動(dòng)了我國(guó)人工智能發(fā)展的算力的提升。
3.? 人工智能與算法
算法是計(jì)算機(jī)解決問(wèn)題或者執(zhí)行計(jì)算的指令序列。很多數(shù)學(xué)模型在具體運(yùn)行時(shí)往往需要實(shí)現(xiàn)相應(yīng)的算法,算法與模型已經(jīng)成為人工智能發(fā)展的重要支撐。人工智能的相關(guān)算法類型眾 多,涉及搜索、規(guī)劃、演化、協(xié)同與優(yōu)化等一系列任務(wù)。當(dāng)下,人工智能領(lǐng)域的快速發(fā)展尤為明顯地體現(xiàn)在一系列新穎算法和模型的發(fā)展,特別是以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)算法的快速發(fā)展。機(jī)器學(xué)習(xí)是一種從觀測(cè)數(shù)據(jù)(樣本)中尋找規(guī)律,并利用學(xué)習(xí)到的規(guī)律(模型)對(duì)未知或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)的方法。隨著數(shù)據(jù)量的急劇增加,從大數(shù)據(jù)中發(fā)現(xiàn)統(tǒng)計(jì)規(guī)律,進(jìn)而利用這些統(tǒng)計(jì)規(guī)律解決實(shí)際問(wèn)題變得日益普遍。
當(dāng)前大多數(shù)機(jī)器學(xué)習(xí)的本質(zhì)是統(tǒng)計(jì)學(xué)習(xí),即通過(guò)歷史標(biāo)注數(shù)據(jù)來(lái)擬合構(gòu)建學(xué)習(xí)模型。以經(jīng)典的線性回歸為例,線性回歸旨在從樣本習(xí)得一個(gè)合適的線性映射f,使得對(duì)于輸入變量 x, 經(jīng)過(guò)
后能夠得到正確的輸出變量 y。假設(shè)我們有房屋面積與價(jià)格之間的歷史數(shù)據(jù)(比如表引 -1 所示,第一列表示 60 米 2 的房屋價(jià)格為 300 萬(wàn),其他列以此類推)。這里的每一對(duì)房屋面積和價(jià)格數(shù)據(jù)(
)就是一個(gè)樣本,所有樣本的集合為(
,
),(
),…,(
)。顯然我們關(guān)心的是根據(jù)房屋面積預(yù)測(cè)房屋價(jià)格。房屋面積
就是輸入變量或者解釋變量,房屋價(jià)格
是我們需要預(yù)測(cè)的變量,是輸出變量,或稱響應(yīng)變量。從這些樣本數(shù)據(jù)學(xué)習(xí)到的房?jī)r(jià)與房屋面積之間的關(guān)系,可以表示為一 個(gè)函數(shù) f(每個(gè)輸入產(chǎn)生確定的唯一的輸出)。f 接收某個(gè)房屋面積作為輸入,預(yù)測(cè)相應(yīng)的價(jià)格作為輸出。例如,對(duì)于表格中不存在的 85平方米的房屋,通過(guò) f函數(shù)我們就可以預(yù)測(cè)其價(jià)格。
為了學(xué)習(xí)房屋面積與房屋價(jià)格之間的函數(shù)關(guān)系,一種常見(jiàn)的學(xué)習(xí)方法是最小二乘法。首先假定f 是簡(jiǎn)單的線性函數(shù)形 式,也就是 f(x) = a + bx,其中 a,b 是參數(shù)。所謂確定 f 的函數(shù)形式,就是確定 a 和 b 兩個(gè)參數(shù)的具體值。因此對(duì) f 的學(xué)習(xí), 就轉(zhuǎn)換為對(duì) a 和 b 兩個(gè)參數(shù)的學(xué)習(xí)問(wèn)題。很顯然,如果 f 是一 個(gè)好的函數(shù),就應(yīng)該盡可能與當(dāng)前已經(jīng)觀測(cè)到的樣本一致,也就是 f(60)應(yīng)該盡可能接近 300 萬(wàn)的真實(shí)價(jià)格。將這一期望推廣到所有已觀測(cè)樣本,就有了如下的誤差函數(shù):
直觀的理解是希望求得的線性函數(shù)(紅色的直線)所預(yù)測(cè)的價(jià)格與實(shí)際價(jià)格累計(jì)平方誤差 最小??梢酝ㄟ^(guò)偏導(dǎo)數(shù)求得上述誤差函數(shù)最小化時(shí)的參數(shù) a 與 b。根據(jù)求得的參數(shù) a 與 b,就可以完全確定函數(shù) f,從而可以根據(jù)任意面積進(jìn)行房?jī)r(jià)預(yù)測(cè)(參見(jiàn)圖引 -8)。機(jī)器學(xué)習(xí)有著很多任務(wù),上述線性回歸只是最簡(jiǎn)單的一類。如果 f 是非線性函數(shù),那么就是非線性回歸問(wèn)題。房?jī)r(jià)是一個(gè)連續(xù)數(shù)值,在有些任務(wù)中要預(yù)測(cè)的是一個(gè)離散量。例如,根據(jù)體溫、血液指標(biāo)等預(yù)測(cè)病人是否得了感冒(只 需要判斷是否感冒這兩種情況),此時(shí)的機(jī)器學(xué)習(xí)問(wèn)題就變成了分類問(wèn)題。此外,我們經(jīng)常需要對(duì)數(shù)據(jù)進(jìn)行聚類,比如將客戶自動(dòng)聚類,從而分為不同人群。除了這些具體的問(wèn)題模型外,機(jī)器學(xué)習(xí)還涉及眾多算法,完成不同的任務(wù),比如 K 近鄰分類算法、基于“決策樹(shù)”的分類算法、基于“支持向量機(jī)”的 分類算法、K 均值聚類算法、基于 PCA 的降維算法、基于梯度下降和進(jìn)化算法的參數(shù)學(xué)習(xí)算法(如線性回歸中的參數(shù)最優(yōu)化學(xué)習(xí))等。
... ... ... ...
聯(lián)系客服