計算機學會ACM是計算機/信息領(lǐng)域最權(quán)威的全球組織。近期ACM對聯(lián)想集團首席技術(shù)官、高級副總裁、ACM Fellow(會士)芮勇進行了專訪,并將專訪的文章放在首頁醒目的位置予以展示。作為計算領(lǐng)域的杰出專家,芮勇博士在專訪中談到自己的學術(shù)研究生涯,并對行業(yè)未來的技術(shù)發(fā)展,比如智能手機、AR/VR以及多媒體計算等發(fā)表了自己前瞻性的看法和觀點,干貨頗多。
學術(shù)研究生涯和多媒體計算的未來
芮勇博士是聯(lián)想集團的首席技術(shù)官和高級副總裁,他也是聯(lián)想技術(shù)研究的領(lǐng)導者,專注于智能設(shè)備、人工智能、云計算、5G和智能生活等方面的技術(shù)研究。作為國際計算機學會ACM Fellow(會士),芮勇?lián)碛?5項美國和國際專利。他是如何一路走來,成為多媒體計算研究領(lǐng)域的杰出專家的呢?
芮勇談到他在本科和碩士時選擇了控制理論和大規(guī)模系統(tǒng)優(yōu)化,這對于后來從事多媒體領(lǐng)域研究的工作,比如相關(guān)性反饋、神經(jīng)網(wǎng)絡和深度學習等,都發(fā)揮了重要的作用。之后其前往伊利諾伊大學厄巴納-香檳分校讀博,開始多媒體分析和檢索的研究。在讀博期間,他抓住了一個機會,參加了美國國家自然科學基金會設(shè)立并資助的 “數(shù)字圖書館”項目,將控制理論,信息檢索和計算機視覺這三個領(lǐng)域融合起來,進行深入的跨學科研究,最終成為了第一批基于相關(guān)性反饋實現(xiàn)圖像搜索的研究者,為圖像搜索創(chuàng)造了一種全新的模式。
取得博士學位后,芮勇很快進入了微軟,繼續(xù)從事多媒體分析、理解和檢索,機器學習,計算機視覺和模式識別等領(lǐng)域的研究工作,在那里工作了18年,之后就進入了現(xiàn)在的聯(lián)想,帶領(lǐng)團隊推進多媒體計算的發(fā)展,并將最前沿的多媒體研究成果融入到聯(lián)想的產(chǎn)品和服務中。
如今這個時代,每天都會產(chǎn)生大量的多媒體數(shù)據(jù)。如何看待未來多媒體分析和檢索的價值?芮勇表示,以深度學習為代表的人工智能算法正在并將繼續(xù)促進多媒體研究,尤其近期深度學習較好構(gòu)建了基于多模態(tài)的算法框架,使得跨領(lǐng)域的多媒體數(shù)據(jù)的有效融合、利用/檢索成為可能。
比如圖像和視頻的描述,幾年前,描述能做的只是給圖像或視頻自動打上標簽,而深度學習建立了計算機視覺和自然語言處理之間的連接,可以將零散的標簽變成一句基于視覺內(nèi)容并且通順連貫的自然語言描述。未來,圖像/視頻描述甚至將支持一段(多句)關(guān)于內(nèi)容的自然語言描述,也將支持更自然的用戶交互系統(tǒng);而支持的模態(tài)也會超越計算機視覺和自然語言處理的范圍,例如,可以導入語音特征、空間深度信息、文本特征等。
未來智能手機形態(tài)可能大變
聯(lián)想是智能手機的主要制造商之一,對于智能手機的未來,芮勇博士表示,未來像人工智能、VR/AR、5G、實時翻譯,新電池技術(shù)以及全息技術(shù)的發(fā)展,都會深刻改變智能手機和用戶的體驗。
他表示,具體來說,無邊框屏,神經(jīng)網(wǎng)絡處理器(NPU),以及更多的傳感器可能會出現(xiàn)在智能手機上傳感器方面,手機將會融合生物特征傳感器、深度攝像頭,多攝像頭以及更好的計算機視覺技術(shù)。此外,5G的發(fā)展會將為手機帶來10倍帶寬和零延遲。
此外,他還提到,智能手機的形態(tài)也可能會發(fā)生很大的變化,其中一個可能是可折疊手機。2016年,聯(lián)想研究院曾研發(fā)出業(yè)界首個真正的可折疊手機原型CPlus和Folio。CPlus可以在手機和腕表之間轉(zhuǎn)換形態(tài),而Folio則可以在平板和手機之間隨意切換。
AR/VR技術(shù)正走向主流
AR/VR技術(shù)已經(jīng)存在了幾十年,為何現(xiàn)在才真正開始走向主流呢?芮勇博士表示,這是因為近年來的技術(shù)突破,比如光學鏡頭,計算機視覺以及即時定位與地圖構(gòu)建,讓AR/VR技術(shù)開始加速發(fā)展,巨大潛力開始顯現(xiàn)。另外,AR/VR可以幫助解決很多行業(yè)上的痛點問題,也能夠給用戶帶來全新的娛樂體驗。
芮勇認為,與VR相比,未來AR很可能會成為一個更大的、更有前景的平臺。尤其是當AR與垂直行業(yè)結(jié)合時,比如教育,培訓以及工業(yè)維護等。在聯(lián)想2017Tech World上,聯(lián)想展示了研發(fā)的晨星AR(daystAR)眼鏡原型以及AR平臺,一位工程師還在現(xiàn)場展示了如何利用這些AR設(shè)備和平臺維修出現(xiàn)故障的飛機發(fā)動機,這反映了VR在垂直領(lǐng)域擁有廣闊發(fā)展前景。另外,在IFA2017展會上,聯(lián)想還聯(lián)合迪士尼推出了一款由智能手機驅(qū)動的AR設(shè)備Lenovo Mirage。
小結(jié):
多年來,我們一直在想象未來的世界會是什么樣?而在我們暢想、展望之前,許多像芮勇一樣的前沿技術(shù)專家,已經(jīng)默默做了很多前瞻性的研究和探索,他們比我們更先一步看到未來的世界。通過芮勇博士的分析和見解,我們看到深度學習為代表的人工智能算法正在改變多媒體研究,并將為我們社會帶來重要價值的新興應用,同時也看到聯(lián)想在AR和智能手機上,也做了很多前沿性的嘗試。期待通過一批批中國企業(yè)和科研人員的奮斗和努力,這更美好的充滿智能的世界能早日來到。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
關(guān)于CNMO | 聯(lián)系我們 | 站點地圖 | 精英招聘 | CNMO記事 | 家長監(jiān)護工程 | 舉報不良信息
Copyright © 2007 -
北京沃德斯瑪特網(wǎng)絡科技有限責任公司.All rights reserved 發(fā)郵件給我們
京ICP證-070681號 京ICP備09081256號 京公網(wǎng)安備 11010502036320號