[打造超級情感機器人并非易事,人在決策過程中的情感往往摻雜太多不穩(wěn)定因素,還需要機器做大量的學習和探索]
讓機器人成為電影《Her》中的人工智能伴侶似乎還有點遠。在大眾消費市場,與機器人的語音互動常常以“我不太明白你在說什么”終結。Alpha-Go、深藍這些機器學習的尖端算法技術和知識,在計算機后臺形成了豐富的資源,但如果不能跟人類交互,其價值遠遠不能算被充分開發(fā)。
現(xiàn)在,情感計算正在幫助完成人機交互這一命題,充分挖掘人工智能技術可能為人類創(chuàng)造的價值。也許在不遠的將來,擁有《超能陸戰(zhàn)隊》中的“大白”不是夢,更多場景將會有它們陪伴。
人工智能背后的情感經(jīng)濟
“AI對我們的定義不僅僅是大數(shù)據(jù)和算法,還有模擬人的行為方式,能夠理解到人講話的意圖,只有語義的理解還不是真正的AI,還包括自然元素里的情感、意圖的理解?!痹谟伞渡虡I(yè)周刊/中文版》主辦的“展望2017”峰會上,竹間智能科技創(chuàng)始人兼CEO簡仁賢告訴記者。
作為微軟(亞洲)互聯(lián)網(wǎng)工程院前副院長,簡仁賢曾負責微軟小冰及小娜產(chǎn)品技術的研發(fā),情感計算是其目前研究的重點領域。根據(jù)用戶文字或語音對話輸入,深度理解對話主題、意圖與情緒,并結合上下文與對用戶的記憶,進行合情合理的回答,這是情感計算最主要的意圖。
早在2012年,受西班牙財政危機的影響,一家巴塞羅那喜劇俱樂部的夜場觀眾流失了三分之一,為了提升上座率,這家喜劇俱樂部別出心裁地采取門票免費但按照觀眾觀看時的笑容數(shù)來收費,結果客源提升了35%,收入也相應增加,負責識別和統(tǒng)計笑容數(shù)量的技術就來自于一家名為Affectiva的公司。
讀懂、聽懂、看懂
這是情感計算的一個片段。在簡仁賢看來,要做好人機交互,首先機器人要能夠做到讀懂、聽懂、看懂。
所謂讀懂就是要解析一句話背后的情感、情緒、心情、感覺,通過搭建情緒模型,并進行深入分析得到答案。此外,對話聚焦主題,并判斷出語言背后的語言行為也是加深理解的重要方面,比如判斷這一語言是咨詢問題,還是詢問意見。
看懂,不僅需要理解自然語言、搭建對話系統(tǒng),更重要的是機器視覺、人臉識別上的技術成熟。精準識別面部表情與動作,能夠判斷一個人情緒變化、情感變化和注意力變化,并能夠在多樣場景上應用。例如一個人走進一個商場,機器如果能夠識別出是緊張的狀態(tài)或是憤怒的狀態(tài),就能為安保工作帶來積極效果。
聽懂則更聚焦在語音識別技術上。同樣的話用不同的語調表達,往往能傳遞不同的意思,高興、無奈、憤怒,都是語音能夠傳遞的不同情感。
簡仁賢認為要實現(xiàn)上述目標,類腦對話機器人、機器視覺、語音情感、多模態(tài)情感計算成為四個可發(fā)展的基礎支撐技術?!岸嗄B(tài)情感計算即對語言、聲音、圖像進行綜合計算分析,得出背后的文字情感、語音情感和面部情感的綜合結果。”簡仁賢解釋道。
精準地判別意圖,才能完成任務。如果一個機器人只能閑聊,就達不到研發(fā)者要建立的黏性跟互動。簡仁賢把目前市場上存在的對話機器人分為三類——只會瞎聊的、指令式的、只懂垂直知識的。
當前對話機器人的普遍問題,就是局限于關鍵字、詞的處理,單句問答,不能理解上下文。實操過程中,只能用“人工”來處理指令,讓機器人們顯得不那么“智能”。
沒有記憶也被認為是機器人對話過程中的頑疾。沒有記憶,就不能積累交流對話中獲取的信息,即不能對人產(chǎn)生一個完整、全面的數(shù)據(jù)畫像,不存在產(chǎn)生理解人喜好、習慣、語言、行為意圖的基礎,就無法做到最人性化、個性化的對話,進一步無法理解人,陷入一個死循環(huán)中。
借助場景定制落地
既然情感機器人能夠理解個人行為和商業(yè)行為的意圖,那通過抽取不同領域內不同的意圖,就可以使未來的機器人達到高度定制化。
實際上,情感機器人就是實現(xiàn)定制化機器人的技術基礎。它能對不同環(huán)境與環(huán)境中的人進行有效理解,并完整互動,基于此進行某部分的技術放大和延伸,從而成為適應該場景的定制機器人。
而現(xiàn)在市場上落地應用的機器人很多反應很遲鈍,就跟無法依據(jù)使用場景定制、工程化不足有關。盡管諸多人工智能公司宣稱自己的識別技術精度在95%以上,但其產(chǎn)品的使用體驗似乎無法匹配如此高的識別精度。
“一般你看到的識別競賽很多都是學術研究機構的,學術跟研究離落地還很遠,中間有很多細節(jié),包括應用場景和工程上,你有可能在實驗室里達到某個效果,但是時間很長,工程化的時候達不到那個效果?!焙喨寿t說。
一項技術如果能制造出5種不同的應用場景,不同場景用不同技術的些微差別去推出,“揚長避短”,這就是定制的本質。
簡仁賢舉例,“例如有些場景可以容忍時間比較長的辨識,那我們就用辨識度最高、時間最多的,有些場景要做到客戶端里面去,就需要時間很短,誤差率比較大,精準度沒有那么高。場景如果允許誤差比較高,那就需要在性能、成本和技術精準上面做一個平衡。落地化然后應用到不同場景,這個是AI落地必須要考量的很重要的一點,也是很多公司沒有注意到的。”
以微軟小冰為代表的聊天機器人也在加入情感計算功能,在浙江大學教授張宏鑫看來,情感計算可以根據(jù)文字對話的上下文找出情緒,優(yōu)化上下文處理,給出推薦內容,從而進行場景的優(yōu)化?!盎ヂ?lián)網(wǎng)的本質是流量,通過情感因素加入可以提升用戶體驗,進而提升流量。但目前準確率確實不會太高,不過對于對話類的與推薦類型的應用已經(jīng)足以應用了,對于定制化的場景比較有效?!睆埡牿胃嬖V第一財經(jīng)記者。
不過打造超級情感機器人并非易事,人在決策過程中的情感往往摻雜太多不穩(wěn)定因素,還需要機器做大量的學習和探索,但針對特定場景例如自閉癥患者治療、美妝領域的客戶顏值測試,安全駕駛方面的疲勞度甄別等等,懂得察言觀色的機器人正在走來。
聯(lián)系客服