什么是人工智能?人工智能在學(xué)術(shù)研究領(lǐng)域已經(jīng)有60年的歷史,經(jīng)歷兩起兩落,產(chǎn)生了很多的理論、算法、模型。通俗的講,狹義的技術(shù)就是對輸入的感知,加以學(xué)習(xí)與訓(xùn)練,使其成為有創(chuàng)造和決策能力的大腦。有種說法“人工智能,有多少人工就有多少智能”,指的就是這種有監(jiān)督的學(xué)習(xí),即用經(jīng)過標(biāo)記的大量數(shù)據(jù)來訓(xùn)練,語音識別、圖像識別、自然語言理解的準(zhǔn)確率基本都是依賴這種學(xué)習(xí)和訓(xùn)練方式來提升的。 更進一步,AlphaGo之所以讓業(yè)界這么興奮,是因為它不完全從歷史上的所有棋局中去學(xué)習(xí),也通過蒙特卡洛樹搜索(Monte Carlo TreeSearch)的方法,讓機器能夠自我對決,從而提升整個系統(tǒng)的棋藝水平,這是進化到了無監(jiān)督式的學(xué)習(xí)階段。
人工智能真正意義上第一次大規(guī)模商業(yè)化的運用是搜索與廣告。2000年后,PC互聯(lián)網(wǎng)上網(wǎng)頁數(shù)據(jù)大量地產(chǎn)生,搜索引擎運用了大量的機器學(xué)習(xí)以及自然語言語義理解來改善搜索結(jié)果關(guān)聯(lián)度;Google和百度的廣告系統(tǒng)大量運用了深度學(xué)習(xí)技術(shù)。這些技術(shù)應(yīng)用讓搜索引擎及其廣告系統(tǒng)造就了一個很好的一個商業(yè)模式。
作為見證了互聯(lián)網(wǎng)與整個移動互聯(lián)網(wǎng)發(fā)展的資深網(wǎng)蟲和多年的資深產(chǎn)品架構(gòu)師,作者分享她對人工智能的理解,以及在這領(lǐng)域內(nèi)的投資想法。
1、從生態(tài)的角度看待人工智能的發(fā)展普及
2007年6月第一代iPhone手機問世,拉開了移動互聯(lián)網(wǎng)發(fā)展的序幕,移動互聯(lián)網(wǎng)進入突飛猛進的高速發(fā)展期。蘋果不僅僅重新定義了手機的交互方式,更是讓一部手機變成了一臺移動智能電腦,通話只是它的基本功能,上面的萬千的應(yīng)用與服務(wù)背后連著的是成千上萬的開發(fā)者。
4個月以后公布Android操作系統(tǒng)的Google,更是同時宣布與34家手機廠商運營商成立“開放手機聯(lián)盟OHA”,讓運營商和終端廠商都成為Android手機營銷推廣的重要渠道。 它將用戶、開發(fā)者、廣告商、廠商、運營商都作為產(chǎn)業(yè)的力量一起助推發(fā)展。短短8年時間,使得全球的20億用戶都用上了智能機,中國的5億人用上了智能機,這就是生態(tài)的力量。
今天看人工智能,計算能力不斷地變強,深度學(xué)習(xí)技術(shù)使數(shù)據(jù)分析建模能力有了長足的進步,行業(yè)的數(shù)據(jù)也有了積累。預(yù)測它真正在用戶與行業(yè)中的普及使用,可以比較大膽地放在一個生態(tài)的角度來看它:
用戶接觸到人工智能,會是某個場景下的某個載體設(shè)備而非虛無的技術(shù)本身。把幾個行業(yè)的例子與智能手機平行看時,會發(fā)現(xiàn)當(dāng)這個設(shè)備有智能傳感器 、 當(dāng)這個設(shè)備連著云端 、有會連著數(shù)據(jù)訓(xùn)練學(xué)習(xí)和決策的人工智能大腦inside時,他們都是智能電腦的變體。
智能手機是可通話的移動智能電腦;
無人駕駛車是可載人的移動智能電腦;
兒童智能動物玩具是可跟兒童玩的移動智能電腦;
兒童智能機器人玩具是可以跟兒童玩的人形移動智能電腦。
這個生態(tài)中包括:
帶技術(shù)的核心硬件
芯片,為響應(yīng)人工智能和深度學(xué)習(xí)的需要,在速度和低能耗方面被提出了更高的要求。
IBM在2014年研制出世界上首個大腦芯片TrueNorth;原來的半導(dǎo)體公司英偉達、英特爾、高通紛紛進入;國內(nèi)的北京君正積極投入,創(chuàng)業(yè)型公司地平線機器人獲大量投資也進入人工智能芯片領(lǐng)域;Google剛發(fā)布人工智能加速器芯片TPUs。總體來說像芯片這種硬件不僅在多個垂直應(yīng)用領(lǐng)域之間難有統(tǒng)一解決方案,甚至在同一垂直領(lǐng)域中現(xiàn)在也還無統(tǒng)一標(biāo)準(zhǔn)。
傳感器之于機器,相當(dāng)于人的眼睛,有非常高的要求。比如無人車領(lǐng)域的光學(xué)LIDAR,直接影響到高精地圖的繪制是否準(zhǔn)確,基于點云的定位以及障礙物檢測是否準(zhǔn)確。 目前LIDAR造價昂貴,在市場上能否被精度不錯但費用較低地量產(chǎn),在很大程度上影響了無人駕駛這個領(lǐng)域的發(fā)展速度。
操作系統(tǒng)OS
手機上Android系統(tǒng)是個開源系統(tǒng),一些垂直領(lǐng)域會直接使用Android,或者基于Android或Linux進行針對性開發(fā);當(dāng)然某些不需要影視系統(tǒng)的垂直領(lǐng)域也有選擇不用操作系統(tǒng)的,比如物聯(lián)網(wǎng)和智能家居領(lǐng)域。
IaaS(Infrastructure as a Service) :給客戶提供云存儲、云計算的服務(wù)。國際上,AWS是最有名的IaaS服務(wù)商,國內(nèi)也已經(jīng)有諸多的公司提供IaaS服務(wù),比如阿里云、騰訊云、新浪云、金山云、京東云秦天、七牛、青云、ucloud、浪潮云。 存儲和計算成本的下降是人工智能機器學(xué)習(xí)的一大促進因素。
PaaS (Platform as a Service) : 給客戶提供了比如CDN加速、 統(tǒng)計、推送、社交分享、 測試等諸多服務(wù)。除阿里云、新騰云、金山云有提供外,個推、環(huán)信等專做某個技術(shù)的公司也提供部分服務(wù)。
BaaS (Backend as a Service) :給客戶提供圖像標(biāo)注、人臉識別、文檔分類、語音識別、預(yù)測模型、情感分析以及模式識別等API,及機器學(xué)習(xí)預(yù)訓(xùn)練模型。
這些云平臺為人工智能技術(shù)在具體領(lǐng)域的落地提供了基礎(chǔ)的后臺保證。
人工智能技術(shù)(有決策和創(chuàng)造能力的大腦)
有決策與創(chuàng)造能力的大腦=感知 學(xué)習(xí)與訓(xùn)練,不同方向所需要的大腦能力是不一樣的,即對感知層面的技術(shù)、學(xué)習(xí)與訓(xùn)練計算都有差異。另外對這個能力的調(diào)用,可能作為API,也可能被打包在整體解決方案甚至硬件中。
App/服務(wù)
這層往往會需要調(diào)用某些AI能力。在目前這樣的發(fā)展階段,結(jié)合了行業(yè)數(shù)據(jù)的方向往往容易產(chǎn)生有價值的服務(wù)。
外形設(shè)備
最終需要落地在OEM設(shè)備上。移動互聯(lián)網(wǎng)基于智能手機;人工智能所對應(yīng)的OEM設(shè)備因垂直應(yīng)用領(lǐng)域的特征而有具體的表現(xiàn),因而產(chǎn)業(yè)鏈中誰掌握渠道這個因素也很重要。
某個領(lǐng)域上述生態(tài)要素的成熟推動其蓬勃發(fā)展。推動力之一為致力于垂直領(lǐng)域內(nèi)軟硬件一體解決方案的公司,比如無人駕駛,從OS到高精地圖、到ADAS系統(tǒng)、到硬件傳感器,有了突破,形成了完整的解決方案,加上品牌汽車OEM,最終讓終端用戶真正使用上這個服務(wù)。
推動力之二為開發(fā)難度的降低,如Android 開發(fā)者平臺使App開發(fā)者有統(tǒng)一標(biāo)準(zhǔn)可以參與開發(fā)一樣,人工智能的開發(fā)工具和相對標(biāo)準(zhǔn)的開源硬件的成熟,若能形成云端智能和終端智能打通的工具平臺,普通開發(fā)者參與開發(fā)難度降低,生態(tài)發(fā)展會大大加速。
2、科技巨頭的布局
互聯(lián)網(wǎng)時代,尤其是移動互聯(lián)網(wǎng)時代,最牛的公司都是擁有生態(tài)的公司。
面對新一波的人工智能科技浪潮,研究這些千億美金以上的科技巨頭做的布局,有利于我們發(fā)現(xiàn)新趨勢。
IBM —— 是人工智能布局最早的公司,源于沒有抓住移動時代,它提前針對下一個時代進行布局。
AI技術(shù):語音語義、深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò) (曾收購過AlchemyAPI)
整體解決方案:商業(yè)解決方案Waston API(提供了一套完整的API,語音到文本、文本到語音、權(quán)衡分析、獨特見解、提問和回答、語氣分析器以及視覺識別。)
云平臺:IBM Bluemix開放云技術(shù)平臺( PaaS 7 種 IBM Watson 服務(wù))、機器學(xué)習(xí)平臺SystemML
硬件:人工智能芯片TrueNorth
產(chǎn)業(yè)布局:深藍計算機;智能機器人(與蘋果、與軟銀機器人Pepper)合作;物聯(lián)網(wǎng);醫(yī)療服務(wù);VR游戲。
Google-Alphabet ——人工智能實力最強大的公司
AI技術(shù):視覺、語音、自然語言、大數(shù)據(jù)、 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 深度學(xué)習(xí)(曾收購過Da rk blue labs、Vision factory、Deepmind、Jetpac、DNNresearch一堆技術(shù)公司)
云平臺:第二代機器學(xué)習(xí)系TensorFlow(包括了各種“預(yù)訓(xùn)練”模型、自然語言處理、推薦系統(tǒng)、模式識別以及預(yù)測功能)
硬件:人工智能加速器芯片TPUs (Tensor processing units)
產(chǎn)業(yè)布局:無人駕駛、基于智能手機的各種app應(yīng)用與插件、智能家具(硬件手表、家具中樞Google Home)、VR生態(tài)(Daydream平臺、VR頭顯與控制器、適用的手機。
AI技術(shù):視覺Deep face技術(shù)(其中收購過face.com)、語音收購過Mobile technologies,自然語義收購Wit.AI、 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 機器學(xué)習(xí)
云平臺:開發(fā)者平臺Parse;在Torch中開源深度學(xué)習(xí)模塊
硬件: Big Sur(基于GPU的用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的硬件系統(tǒng),開源)
產(chǎn)業(yè)布局:語音助手Moneypenny;VR的生態(tài)(硬件收購Oclus Rift頭盔、能拍照的Sourroud360全景攝像機促進內(nèi)容發(fā)展)
Microsoft
AI技術(shù):語音、視覺、自然語言、分布式機器學(xué)習(xí)
云平臺:Microsoft Azure(存儲、計算、數(shù)據(jù)庫、live、媒體功能);分布式機器學(xué)習(xí)工具包DMTK(自然語言處理,推薦引擎,模式識別,計算機視覺以及預(yù)測建模等)
產(chǎn)業(yè)布局:語言助手(微軟小冰、小娜、Tay)、VR(Hololens全息眼鏡)
Apple
AI技術(shù):自然語言收購Vocal IQ、收購可視化地圖MapsenseGPS公司 Coherent Navigation
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、SIRI語音
Amazon
云平臺:Amazon Web Services(存儲、計算、模式識別和預(yù)測,其中視頻識別API 收購Orbeus)
阿里
云平臺(阿里云IaaS強,可視化人工智能平臺 DTPAI)
產(chǎn)業(yè)布局 :智能家具、物聯(lián)網(wǎng)
騰訊
AI技術(shù):視覺
產(chǎn)業(yè)布局:智能硬件
百度—— 未在千億美金公司之列,但在人工智能的布局上不容被忽略
AI技術(shù):語音、視覺、自然語言與智能語義、自動駕駛、深度學(xué)習(xí)
整體解決方案:基于智能手機的語音服務(wù)系統(tǒng)(度秘)
開發(fā)者云平臺: 百度云
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、基于智能手機的各種app應(yīng)用與插件。
可以看到:
在人工智能領(lǐng)域軟件系統(tǒng)開源是個常態(tài),多家巨頭都將自己的人工智能系統(tǒng)開放出來,也已有巨頭在硬件開源方面進行嘗試,這有利于業(yè)內(nèi)更多的企業(yè)和工程師參與人工智能領(lǐng)域的研發(fā),產(chǎn)生更多有價值的研究成果。模型與基礎(chǔ)算法并非核心競爭壁壘,結(jié)合行業(yè)數(shù)據(jù)的使用才產(chǎn)生巨大的價值。
科技巨頭不斷通過收購技術(shù)與有技術(shù)含量的團隊,來增加實力。意味著創(chuàng)業(yè)公司退出的路徑之一是被巨頭公司并購。
有實力的巨頭旨在建立生態(tài),從AI技術(shù)、整體解決方案、云平臺,到硬件和產(chǎn)業(yè)都有完整的布局。生態(tài)之間是獨立的,因而最強的巨頭間是競爭關(guān)系,而上下游的軟硬件提供者卻有廣泛合作關(guān)系。廣大的開發(fā)者可依附于生態(tài)做發(fā)展。
3、這個領(lǐng)域的創(chuàng)業(yè)機會
從生態(tài)發(fā)展和大公司的布局來看,人工智能生態(tài)尚處于早期階段。目前兩大方向我們是很看好的:
結(jié)合行業(yè)數(shù)據(jù)訓(xùn)練后形成的場景化應(yīng)用
應(yīng)用于醫(yī)療。拍片后的診斷,各種化驗單的檢驗結(jié)論,醫(yī)生根據(jù)經(jīng)驗來診斷,歷史上已經(jīng)積累足夠多的樣本,機器學(xué)習(xí)后也能掌握這種技能。
應(yīng)用于金融。風(fēng)控利用大數(shù)據(jù)計算,將不同來源的數(shù)據(jù)結(jié)構(gòu)化地整合到一起,語義化地理解其中的風(fēng)險點。
應(yīng)用于零售業(yè)。機器學(xué)習(xí)來預(yù)測每款商品在未來時間段的銷量,零售商釋放庫存管理壓力。
類似例子不勝枚舉。 深度學(xué)習(xí)技術(shù)使數(shù)據(jù)分析建模能力有了長足的進步,行業(yè)的數(shù)據(jù)也有了積累,結(jié)合不同的行業(yè)數(shù)據(jù)訓(xùn)練,場景化應(yīng)用機會非常多。
用核心技術(shù)打造人工智能生態(tài)中的“生產(chǎn)工具”
垂直領(lǐng)域的整體解決方案。無人駕駛、智能家具、工業(yè)機器人、兒童機器人,涉及的生態(tài)構(gòu)成比較長,同時又有巨頭公司在布局。其中能解決垂直領(lǐng)域中的核心問題從而產(chǎn)生可應(yīng)用的整體解決方案的公司,將是很偉大的公司。
關(guān)鍵技術(shù)點突破。圖像、語音、自然語言語義、人機交互等。
核心硬件的突破。新的有技術(shù)含量的關(guān)鍵硬件的崛起。比如同一垂直領(lǐng)域中統(tǒng)一標(biāo)準(zhǔn)的傳感器,像降低造價的LIDAR。
BaaS服務(wù),比如結(jié)合行業(yè)數(shù)據(jù)訓(xùn)練后形成的算法應(yīng)用進一步形成垂直行業(yè)的場景標(biāo)準(zhǔn)化智能產(chǎn)品,服務(wù)于客戶與開發(fā)者。
總體而言,在能使得開發(fā)難度大大降低的云端智能和終端智能打通的工具平臺與生態(tài)成熟之前, 這個領(lǐng)域的創(chuàng)業(yè)機會只屬于有技術(shù)能力的團隊。
聯(lián)系客服