機(jī)器看一眼就能識別物體 谷歌DeepMind新成果
機(jī)器看一眼就能識別物體 谷歌DeepMind新成果
引導(dǎo)語:度學(xué)習(xí)系統(tǒng)是一種神經(jīng)網(wǎng)絡(luò),其中不同層次互聯(lián)元件的敏感性可以在訓(xùn)練中得到調(diào)節(jié),從而模擬人腦中的神經(jīng)元。這類系統(tǒng)通常需要觀察大量圖片,才能正確調(diào)節(jié)虛擬神經(jīng)元之間的連接。
對于某一對象,大部分人只要看過一遍就能再次識別。但計(jì)算機(jī)視覺和語音識別算法往往需要“觀察”數(shù)千個對象,才能識別出類似的新圖片或新單詞。
對于這樣的問題, 谷歌 (微博)DeepMind的研究人員找到了解決方案。他們對深度學(xué)習(xí)算法做出了調(diào)整,使其可以在“觀察”一張圖片后就能識別出類似圖片,這也被稱作“一次完成學(xué)習(xí)”。該團(tuán)隊(duì)利用包含多張有標(biāo)記圖片的大型數(shù)據(jù)庫演示了這項(xiàng)技術(shù),此外還演示了這項(xiàng)技術(shù)在手寫文字和語言識別方面的應(yīng)用。
最優(yōu)秀的.算法能可靠地識別出對象,但由于對數(shù)據(jù)的需求,開發(fā)這樣的算法耗時耗力。例如,能識別道路上車輛的算法需要人工輸入數(shù)千個范例,隨后才能被用于無人駕駛汽車。收集如此多的數(shù)據(jù)往往不可行。例如,在來到陌生的家庭后,機(jī)器人不可能有大量時間去熟悉環(huán)境。
谷歌DeepMind研究科學(xué)家歐利奧爾·溫亞爾斯(Oriol Vinyals)給深度學(xué)習(xí)系統(tǒng)加入了記憶元件。深度學(xué)習(xí)系統(tǒng)是一種神經(jīng)網(wǎng)絡(luò),其中不同層次互聯(lián)元件的敏感性可以在訓(xùn)練中得到調(diào)節(jié),從而模擬人腦中的神經(jīng)元。這類系統(tǒng)通常需要觀察大量圖片,才能正確調(diào)節(jié)虛擬神經(jīng)元之間的連接。
該團(tuán)隊(duì)利用名為ImageNet的數(shù)據(jù)庫展示了這項(xiàng)技術(shù)。這一數(shù)據(jù)庫中包含大量有標(biāo)簽照片。軟件仍需要分析數(shù)百種圖片類別,但在此之后,軟件只需要“觀察”一張照片,例如寵物犬的照片,即可識別出新照片中的寵物犬。實(shí)際上,該軟件能高效地識別出圖片中獨(dú)有的特征。這種系統(tǒng)的識別準(zhǔn)確率與傳統(tǒng)需要大量數(shù)據(jù)輸入的機(jī)器學(xué)習(xí)系統(tǒng)基本相當(dāng)。
溫亞爾斯表示,如果能迅速識別出新單詞的含義,那么這一系統(tǒng)將尤為有用。這對谷歌來說將很重要,因?yàn)檫@可以幫助系統(tǒng)迅速學(xué)習(xí)新搜索關(guān)鍵詞的含義。
其他研究者也在開發(fā)“一次完成的”學(xué)習(xí)系統(tǒng),但這類技術(shù)通常與機(jī)器學(xué)習(xí)不兼容。去年,一個學(xué)術(shù)項(xiàng)目利用概率編程技術(shù)實(shí)現(xiàn)了非常高效的學(xué)習(xí)。
深度學(xué)習(xí)系統(tǒng)正變得越來越強(qiáng)大,尤其是在加入了記憶機(jī)制之后。谷歌DeepMind的另一個團(tuán)隊(duì)近期開發(fā)了一種具備靈活記憶能力的神經(jīng)網(wǎng)絡(luò),從而完成簡單的推理任務(wù)。例如,在分析了幾張簡單的網(wǎng)絡(luò)圖之后,這一系統(tǒng)能學(xué)會如何在復(fù)雜的地鐵系統(tǒng)中找到路線。
韓國大田先進(jìn)科技研究所大腦和機(jī)器智能實(shí)驗(yàn)室負(fù)責(zé)人Sang Wan Lee表示:“我認(rèn)為這是個非常有趣的方法,在如此大規(guī)模數(shù)據(jù)集的基礎(chǔ)上,通過有趣的方式去實(shí)現(xiàn)一次完成學(xué)習(xí)。這是對人工智能研究社區(qū)的重要技術(shù)貢獻(xiàn),而計(jì)算機(jī)視覺研究員將會非常關(guān)注這一成果。”
不過另一些業(yè)內(nèi)人士則對這類技術(shù)的實(shí)用性表示了懷疑,因?yàn)檫@與人類學(xué)習(xí)相比仍有很大差異。哈佛大學(xué)大腦科學(xué)系助理教授薩姆·戈?duì)柺猜?Sam Gershman)表示,人類通常是根據(jù)照片畫面的組成元素去理解照片,這需要真實(shí)世界知識,或者說常識。例如,“平衡車看起來可能與自行車和摩托車完全不同,但實(shí)際上是由相同的部件組成的”。
戈?duì)柺猜蚐ang Wan Lee指出,機(jī)器學(xué)習(xí)的能力達(dá)到人類水平還需要一段時間。后者表示:“我們?nèi)赃h(yuǎn)遠(yuǎn)沒有揭開人腦一次完成學(xué)習(xí)的奧秘。然而這種方法很明顯提出了新挑戰(zhàn),并值得進(jìn)一步研究。”(編譯/陳樺)
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 yyfangchan@163.com (舉報(bào)時請帶上具體的網(wǎng)址) 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除