谷歌為機器人注入人工智能。如此,可以輔助完成一些任務(wù)的機器人,也許有一天就可以為老年人提供一個支撐臂,或者分類垃圾?
在最近一次參觀 Alphabet X 實驗室后,國外知名媒體人 Tom Simonite,在 wired 文章中講述了一個這樣的小插曲:
“我倒掉咖啡,把杯子放在了一個標有“罐頭和瓶子”的托盤上。這種“違規(guī)”行為很快就得到了補救。20 分鐘后,一個只有一只手臂、高達胸部的輪式機器人疾馳而過,并用裝在它扁平腦袋里的 3D 攝像機,觀察著杯子。然后,它伸出手臂,用兩個結(jié)實的黃色手指,把這個錯誤的杯子,移到旁邊“堆肥”標簽的綠色托盤上”。
快想想他的樣子,這就是個可以走出動畫的瓦力啊!
真機版“瓦力”
這個可以識別垃圾的機器人,來自于一個名叫“Everyday Robot”的項目。
眾所周知,垃圾識別類的機器人項目已開發(fā)多年,但是在公共領(lǐng)域應(yīng)用的思考,對于 X 來說才剛剛開始。
應(yīng)用從自己家開始:
在山景城 X 之家附近,一些新機器被成圈地放置在垃圾站前,供二樓的工作人員使用。用來練習(xí)他們的導(dǎo)航,和將垃圾從堆肥和垃圾填埋場垃圾中分類回收的能力。
另外一些相同設(shè)計的機器人,則被安排在 Alphabet 大樓附近。項目的核心恰恰在于 X 大樓的二樓。
仿佛是對辦公室生活的一種諷刺:
與 X 工程師的辦公桌混在一起,靠近窗戶俯瞰的最佳位置,近 30 個灰色的單臂機器人在各個工作站上勞作。每個人站在裝滿垃圾的三個托盤前,一整天都在把垃圾分配到不同的托盤里,分為“堆肥”和“填埋”,以便回收。
當機器人把所有東西都放好后,它會在每個托盤上抬起一個把手,把分類好的垃圾倒入下面的垃圾桶里,然后,一個人類主管會把新一批垃圾,分給他們繼續(xù)分類。這個系統(tǒng)被 X 工程師命名為 playpen。
這個有意思的項目出就自于山景城里的 X 實驗室。
背靠谷歌母公司 Alphabet,成立于 2010 年的 X 實驗室,曾不時冒出過一些如太空升降梯、氣球上網(wǎng)、海水提煉燃料、智能眼鏡等天馬行空的想法,但他們有一個目標:系統(tǒng)化挑選有前途技術(shù)。這個創(chuàng)意工廠堅持三個重要條件,排除那些 99% 的跨不過“高門檻”的項目:
1. 必須是解決能夠影響數(shù)百萬甚至數(shù)十億人的大問題
2. 必須提出徹底解決這個問題的辦法
3. 必須有突破性的技術(shù)來解決問題。
這么看來,垃圾分類機器人也許就能實現(xiàn)以上三點中的其中一點。
如何創(chuàng)造“瓦力”
領(lǐng)導(dǎo) X 實驗室機器人項目的漢斯——彼得·布朗多希望有一天能制作出幫助老年人在家里更獨立生活的機器人版本
垃圾分類不是項目的最終目標!拔覀兿雵L試制造這樣的機器人,你明白,就是能夠和我們一起生活,幫助我們在日常生活中度過難關(guān)的那種,”領(lǐng)導(dǎo)該項目的挪威高管漢斯-彼得·布朗多(Hans-Peter Brondmo)說道。這就是該項目的“登月計劃”,一個實驗室自我神化的代指。
垃圾分類被視為一項對于便利的挑戰(zhàn),被用來驗證該項目的方法,以便于創(chuàng)造更具能力的機器人。它利用與谷歌合作開發(fā)的人工智能軟件,制造出可以通過在職體驗,學(xué)習(xí)復(fù)雜任務(wù)的機器人。希望能使機器人在技術(shù)上減少對人類編碼的依賴,并能快速適應(yīng)復(fù)雜的新任務(wù)和環(huán)境。
這個移動錯位咖啡杯的機器人使用了一個控制系統(tǒng),即前文提到的 playpen。該系統(tǒng)是由數(shù)十個機器人,耗時五個月,通過收集每周五天的垃圾分揀經(jīng)驗,磨練而成。X 實驗室表示,它的“獵月”員工們通常把大約 20% 的垃圾放錯位置,而這些機器人可以將這一比例降低至 4% 以下,來幫助 Alphabet 實現(xiàn)山景城的回收目標。
傳統(tǒng)意義上,機器人遵循人類編碼員編寫的特定指令。通常,機器人會在工廠等受控環(huán)境中工作。但是,在家中或是辦公室里,幫助人們的機器人面臨著太多環(huán)境的變化,而編碼人員無法預(yù)測,或是對這些變化作出對響應(yīng)。
“這只不過是打鼴鼠的游戲,”本杰·霍爾森(Benjie Holson)說。這個留著胡子,穿著錫制機器人襯衫的軟件工程師,看著游戲室里慢慢地移動的機器人說:“我們最大的賭注是編寫一個程序,讓機器人在野外練習(xí)打鼴鼠!
布朗多則說:“我們還沒有解決整個問題,但我們已經(jīng)取得了足夠多的進展,對于我們正在做的事情,我們有很有信心。”
正當他說話時,機器人偶爾會在垃圾站之間來回走動。偶爾從他的辦公室經(jīng)過。這樣也能看出項目目前的進展和局限。同時每一個機器人都有至少一名 X 員工的看護,如果出了什么問題,可以按機器人脖子上的紅色按鈕停止他的行動。
一場數(shù)百萬美元的混戰(zhàn)
“Everyday Robot”項目最早開始于 2013 年。
2013 年,谷歌高管、安卓(Android)聯(lián)合創(chuàng)始人安迪·魯賓(Andy Rubin)辭去了該公司 Android 移動軟件部門的領(lǐng)導(dǎo)職務(wù)。在他離開之前,該部門進行了一些引人注目的收購:這些初創(chuàng)公司的技術(shù)從全人形機器人到工業(yè)機器手臂等,其中包括 MIT 分支的波士頓動力(Boston Dynamics)。
瘋狂地用公司支票給機器人消費的行為,讓谷歌開始認真做起了機器人。
但魯賓從來沒有公開地為那些機械生物提出過明確的策略。在被指控性騷擾后,于 2014 年離開了谷歌,把剩下的問題留給了其他人。
2016 年,布朗多加入了 X 實驗室。就在他剛剛加入之前,Alphabet 的領(lǐng)導(dǎo)們認為 X 實驗室是其脫節(jié)機器人技術(shù)孵化的最佳場所(波士頓動力公司于 2017 年被出售給日本軟銀集團。)
也許是因為 X 實驗室是世界上唯一一個鼓勵、甚至要求定期探究荒唐想法的組織。
就像上文中提到的那樣,X 實驗室曾悄悄地探討過太空升降梯和冷核聚變方案,放棄了嘗試過的磁懸浮式的懸浮滑板、海水燃料設(shè)計;但他們也成功制造了能配送空氣動力套件的無人機,用各種各樣方式生產(chǎn)的自動駕駛汽車,以及設(shè)計了通過眼淚就可以測試糖尿病患者血糖水平的隱形眼鏡。
盡管項目攔截率高達 99%,他們還是出產(chǎn)了 Waymo 無人駕駛、Google Watch、Dandelion 地?zé)崮茉匆约?Verily 醫(yī)療等“畢業(yè)項目”。
根據(jù)今年 3 月的一份報告顯示,谷歌顯然正在重新涉足機器人領(lǐng)域。X 的領(lǐng)導(dǎo)層利用谷歌的機器人“殘羹剩飯”創(chuàng)建了多個“登月項目”。由布朗多領(lǐng)導(dǎo)的 Everyday Robot 是第一個被公開的。其新機器人也在學(xué)習(xí)如何抓取,但谷歌的工作似乎與日常機器人有所不同。
谷歌的人工智能研究小組參與了這一“賭注”。它專門研究機器學(xué)習(xí)算法,從示例數(shù)據(jù)中獲取技能,并在大約五年前開始將其應(yīng)用于機器人控制。X 工程師在這個項目上進行了合作,并托管了硬件。
這項合作的第一個成果被稱為“手臂農(nóng)場”。
14 個工業(yè)機器人手臂,簡單地把握住的一些鋼筆、毛絨玩具和畫筆等雜物放在裝滿的托盤前。研究人員編寫了一些初始代碼,指導(dǎo)機器人抓取物體,并讓它們一遍又一遍地執(zhí)行。他們成功和失敗的數(shù)據(jù)都會提供給機器學(xué)習(xí)的算法,逐漸完善機器人的能力。經(jīng)過兩個月 80 萬次的嘗試,它成功地抓住了 80% 以上的物體。
Alphabet 公司正在其兩棟大樓內(nèi)測試垃圾分類機器人,他們在那里進行查房,檢查垃圾是否正確分類
Everyday Robot 的負責(zé)人漢斯-彼得·布朗多告訴《連線》雜志,他希望有一天能制造出一個能幫助老人的機器人。但他也承認,這樣的事情可能要過幾年了——所以目前看來,機器人在分類垃圾方面會不斷進步。
X 和 Google 后來增加了一種稱為強化學(xué)習(xí)(reinforcement learning)的技術(shù),被應(yīng)用于棋盤游戲 Go 中并歷史性地擊敗一名冠軍。還被用來和來自 arm farm 的數(shù)據(jù)結(jié)合,這部分數(shù)據(jù)來源于與機器人在模擬實驗室中的數(shù)字雙打。結(jié)合仿真數(shù)據(jù),七個實體機器人不到一天的工作,就為系統(tǒng)提供了足夠的數(shù)據(jù),使系統(tǒng)可以在 90% 以上的時間成功地抓取物體。
X 的 playpen 系統(tǒng)中的機器人,為這種方法的改進提供了動力。
他們每天一遍又一遍地分類和抓取垃圾。到了晚上,在一些如 X 實驗室兩倍的建筑中,收集更多的經(jīng)驗。這兩項工作的數(shù)據(jù)結(jié)果,每晚都被用于調(diào)整控制系統(tǒng)的算法。經(jīng)過質(zhì)量控制檢查,以避免流氓機器人。每星期或每兩個星期控制系統(tǒng)都會得到一個升級。
自 6 月份開始,這些機器人已經(jīng)將他們分類的錯誤率減少到 3.5%。在這個過程中,機器人開發(fā)出了更可靠的方法。當物品被它們擊倒時,它們可以更好地將手指放在杯子和罐頭之類的物品上,抓起來;ㄔ playpen 上的時間,可以看出一些驚人的技術(shù)復(fù)雜度。playpen 的機器人有時會使用滑動或攪拌動作來移動物品,這種方式更便于它們看到和抓取。
你不必花很長時間和 X 的機器人呆在一起,就能明白他們還沒有做好服務(wù)日常的準備。
在 playpen 中,一個機器人抓向稀薄的空氣,而不是它看起來要瞄準的碗。不受受驚,它其實真正放下它的動作。有時它們也會和托盤邊緣發(fā)生碰撞,或摸索物體。如果一個機器人失去了一根手指,監(jiān)督它的工程師會立馬揮舞著螺絲刀跳起來。
為該項目定制的機器人,結(jié)合了由 Waymo 開發(fā)的 3D 激光掃描儀或激光雷達等高端部件,以及廣泛使用的塑料,這會使未來的商用版本更加實惠。這項工作也正在進行中。
機器人設(shè)計師 Justine Rembisz 說:“因為我們還處在這個過程的早期,而它們并不總是按照我們希望的方式工作!
X 公司有一個機器人法醫(yī)小組,全天致力于找出機器的故障。
一個最新案例需要弄明白的是,當機器人被引入第二座 Alphabet 大樓進行測試時,它們?yōu)槭裁淳芙^移動。結(jié)果表明,建筑物天窗的光線,使機器的傳感器在地板上產(chǎn)生幻覺。
“機器人的癥狀常常讓人有些困惑,”法醫(yī)小組的負責(zé)人莎拉·科(Sarah Coe)這么說。
最大的疑惑在于,機器學(xué)習(xí)是否真的能讓機器人完成許多不同的日常任務(wù)。
“每個人都有這樣的直覺,”加州大學(xué)伯克利分校教授、創(chuàng)業(yè)協(xié)變公司(startup Covariant)的聯(lián)合創(chuàng)始人彼得·阿比爾(Pieter Abbeel)說,該公司尋求將機器人學(xué)習(xí)應(yīng)用于工業(yè)和商業(yè)環(huán)境!澳銓W(xué)會了分類垃圾,于是現(xiàn)在又能更快地學(xué)會下一件事,也許還能擺好桌子!
盡管 X 實驗室和他人取得了令人鼓舞的成果,但還沒有人證明直覺是正確的。
阿比爾說:“沒有確鑿的證據(jù)表明,機器人技術(shù)中的任務(wù)之間存在大量的轉(zhuǎn)移!耙苍S人們還沒有建立一個足夠大的實驗來實現(xiàn)它!
布朗多說,如何證明花幾個月時間學(xué)習(xí)的垃圾分類,將有助于他的機器人更快地完成其他任務(wù),是他團隊 2020 年優(yōu)先的任務(wù)之一。
當被問及在多久之后,日常機器人才能成為有用的幫手時,他談到,在遙遠的一天,這樣的機器如何幫助像他母親這樣的一類人——他母親最近已經(jīng) 81 歲了,每天靠著看護的四次到訪維持正常生活。
“當我給她打電話時,她說的第一句話總是『機器人什么時候來』,”布朗多說。這個問題是開玩笑的,他的答案也是。“我說,『嗯,可能還要再過幾年!弧