九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
把李世乭逼到認(rèn)輸?shù)氖窃鯓右粋€AI?8個問題帶你認(rèn)識AlphaGo

北京時間3月9日12:00整,一場舉世矚目的圍棋“人機世界大戰(zhàn)”在韓國首爾上演。比賽一方為谷歌公司研制的人工智能程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世乭九段。

經(jīng)過3個半小時的鏖戰(zhàn),李世乭九段投子認(rèn)輸,輸?shù)袅诉@五番棋中的第一場。

不管最終結(jié)果如何,

未來已經(jīng)來臨!

關(guān)于這場世紀(jì)大戰(zhàn),有8個問題你需要知道。

1,為什么要研究圍棋AI?
為什么是圍棋,不是別的?


游戲,是AI最初開發(fā)的主要戰(zhàn)地之一。博弈游戲要求AI更聰明、更靈活、用更接近人類的思考方式解決問題。游戲AI的開發(fā)最早可以追溯到1952年的一篇博士論文。1997年,國際象棋AI第一次打敗頂尖的人類;2006年,人類最后一次打敗頂尖的國際象棋AI。歐美傳統(tǒng)里的頂級人類智力試金石,在電腦面前終于一敗涂地,應(yīng)了四十多年前計算機科學(xué)家的預(yù)言。


1997年紐約,與IBM深藍(lán)電腦終局對弈開始時,一臺電視監(jiān)視器上的加里·卡斯帕羅夫。 Credit Stan Honda/Agence France-Presse 

但有一個游戲始終是人類大腦的專利——古老的圍棋。 圍棋AI長期以來舉步維艱,頂級AI甚至不能打敗稍強的業(yè)余選手。這似乎也合情合理:國際象棋中,平均每回合有35種可能,一盤棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤棋可以長達(dá)150回合。這一巨大的數(shù)目,足以令任何蠻力窮舉者望而卻步——而人類,我們相信,可以憑借某種難以復(fù)制的算法跳過蠻力,一眼看到棋盤的本質(zhì)。

2,研究下棋AI,需要研究人員的下棋水平很高嗎?


不需要。AlphaGo背后是一群杰出的計算機科學(xué)家,確切的說,是機器學(xué)習(xí)(machine learing)算法領(lǐng)域的專家。科學(xué)家利用神經(jīng)網(wǎng)絡(luò)算法,將棋類專家的比賽記錄輸入給計算機,并讓計算機自己與自己進(jìn)行比賽,在這個過程中不斷學(xué)習(xí)訓(xùn)練。某種程度上講,AlphaGo的棋藝不是開發(fā)者教給他的,而是自學(xué)成才。


面對人類,阿爾法狗還有一個巨大的缺陷:沒有手。上圖左邊的是阿法狗的制作者之一,他負(fù)責(zé)替阿爾法狗完成落子的動作。

不過,研究出AlphaGo的(Deepmind)創(chuàng)始人 杰米斯·哈薩比斯(Demis Hassabis)確實是棋類的狂熱愛好者,哈薩比斯四歲開始接觸國際象棋,并很快進(jìn)化成神童級人物。正是在博弈游戲上的興趣讓哈薩比斯開始思考兩個重要問題:人腦是怎樣處理復(fù)雜信息的?更重要的,電腦也可以像人類一樣嗎?博士期間的哈薩比斯選擇了學(xué)習(xí)認(rèn)知神經(jīng)科學(xué)和計算機神經(jīng)科學(xué)。今天,38歲的哈薩比斯帶著他的AlphaGo,向人類最頂級的博弈游戲之一——圍棋發(fā)起進(jìn)攻。

3,AlphaGo算法里的“神經(jīng)網(wǎng)絡(luò)”是個啥?

AlphaGo 的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)?!安呗跃W(wǎng)絡(luò)”(policy network)和 “值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里——本質(zhì)上,這和人類棋手所做的一樣。


其中,“值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;

而“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。

AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會判斷當(dāng)前局面以及推斷未來的局面一樣。這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。


4,今天AlphaGo和過去的深藍(lán),誰更厲害?


我們先來看看圍棋和國際象棋之間有什么差別:

第一,圍棋每一步的可能下法非常多:圍棋手在起手時就有19X19=361種落子選擇,在比賽的任意階段,也都有數(shù)以百計的可能下法。但國際象棋的可能下法通常只有50種左右。圍棋最多有3^361種局面,這個數(shù)字大概是10^170,而已經(jīng)觀測到的宇宙中,原子的數(shù)量才10^80。國際象棋最大只有2^155種局面,稱為香農(nóng)數(shù),大致是10^47。

第二,對國際象棋來說,只需要把目前棋盤上剩余棋子的價值總和算出來,就能大概知道棋盤上誰處于優(yōu)勢了。但這種方法對圍棋來行不通,在圍棋的棋局中,計算機很難分辨當(dāng)下棋局的優(yōu)勢方和弱勢方。

可見,同樣是下棋,對付圍棋要比對付國際象棋棘手得多。

讓我們直觀的看一下國際象棋和圍棋的復(fù)雜度對比,上圖是國際象棋,下圖是圍棋:

圖片來自Google

另外深藍(lán)就是專門制造出來下國際象棋的。它評估盤面的標(biāo)準(zhǔn)完全依賴于國際象棋本身的規(guī)則,除了下棋它就干不了別的了,連五子棋都不會!但AlphaGo不同,圍棋只是他的一個測試平臺。工程師可以通過圍棋,發(fā)展和測試AlphaGo的能力。這個能力將來會運用到各個領(lǐng)域。就像《星際爭霸》還是角色扮演游戲中的NPC,高級人工智能不僅能成為強有力的對手,也可以變成優(yōu)秀的團隊伙伴。


5,在戰(zhàn)勝樊麾之后的5個月里,AlphaGo都在干嘛?它可能在哪些方面“進(jìn)化”?


有關(guān)AlphaGo在這幾個月的“進(jìn)化程度”,谷歌官方并沒有給出任何確切的介紹。但是有位名叫安德斯·可魯夫(Anders Kierulf)的圍棋游戲設(shè)計師給出了這樣的猜測:

在深藍(lán)對戰(zhàn)卡斯帕羅夫的過程中,工程師們可以在比賽間調(diào)整深藍(lán)的算法,比如修復(fù)bug。對AlphaGo來說,這可能并非易事。比如說,對戰(zhàn)樊麾時,第二局的31步是AlphaGo的失誤:


要是換了別的場景,那么這步棋是正確的局部著法——但AlphaGo對全局整體的理解還不夠充分。在這種情況下,避免特定的錯誤則更容易一些。在去年十月,AlphaGo并沒有使用開放的庫,但在三月的比賽前,Google大可以把庫添加進(jìn)去,至少可以在比賽間調(diào)整(如果一盤棋里走錯,就在下一盤前手動添加,這樣下一盤棋就不會再錯),這樣李世石就無法連續(xù)幾盤利用同一個定式錯誤。

在比賽前,Google可以做的改進(jìn)還有:

  • 改進(jìn)AlphaGo的神經(jīng)網(wǎng)絡(luò)。在對樊麾的比賽中,他們使用了3000萬個位置作為原始數(shù)據(jù),來訓(xùn)練AlphaGo的價值網(wǎng)絡(luò)。在對李世石的位置中,他們可以使用1億個位置訓(xùn)練。

  • 額外訓(xùn)練AlphaGo的投骰(rollout)策略,然后將改進(jìn)過的投骰策略加入到價值網(wǎng)絡(luò)的訓(xùn)練中。

  • 調(diào)整投骰和價值網(wǎng)絡(luò)之間的平衡,也可以在比賽本身中投入更大的運算量。


6,AlphaG的超強學(xué)習(xí)能力有沒有上限?

對于這個問題,英國曼徹斯特大學(xué)計算機科學(xué)教授凱文·柯倫表達(dá)了否定態(tài)度。他認(rèn)為,我們沒有理由相信技術(shù)會有極限,特別是在AlphaGo這樣的特定領(lǐng)域。


對戰(zhàn)的最后時分。之后,李世乭投子認(rèn)輸。

而來自南京大學(xué)計算機系的兩位專家,周志華和俞揚則都認(rèn)為,上限是客觀存在的。周志華表示,“強化學(xué)習(xí)”奏效的關(guān)鍵,是兩個模型都不錯,而且有足夠大的“差異”。當(dāng)模型性能提升以后,其差異會顯著下降,到了一定程度必然會使性能無法繼續(xù)通過這種機制提升。其上限取決于高質(zhì)量“有標(biāo)記”樣本(相當(dāng)于真實李世乭水平棋手的棋局)的數(shù)量。

俞揚的觀點是,上限不僅存在,而且已經(jīng)和AlphaGo當(dāng)下的水平極其接近。從AlphaGo的報道來看,DeepMind已經(jīng)在想辦法避免過擬合(即越學(xué)越差),這說明他們可能已經(jīng)碰到了上限。


7,如果在全部5局中,

AlphaGo以5:0戰(zhàn)勝李世乭,

對人工智能而言意味著什么?


正如本文開頭所說,未來已經(jīng)來臨。無論最終的結(jié)果如何,都無法阻止更多的人類終于開始用警惕的目光打量AI……圍棋職業(yè)八段劉菁的評論是:“還來不及反應(yīng),一切來的似乎是太快了!面對毫無表情,連廁所都不上的阿爾法狗,4000年圍棋的終結(jié)者今天就來了嗎?空氣中彌漫著機器的味道?!?/p>

就算AI輸了,難道你們就松口氣了嗎?

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
人工智能革命性突破!最難的圍棋,人腦也擋不住電腦了
發(fā)展AlphaGo的最終目的,是幫助人類在科學(xué)領(lǐng)域取得進(jìn)步 I DeepMind創(chuàng)始人訪談
樹澤:假如讓阿爾法狗狗來做A股
當(dāng)你擁有世界上最聰明的大腦……丨人物
人工智能發(fā)展簡史
Google 的人工智能擊敗了人類圍棋冠軍,這事為什么如此重要?
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服