導(dǎo)讀:自動(dòng)駕駛的基礎(chǔ)是算法,但短期之內(nèi),AI本身的發(fā)展還是要依賴人類大腦的巧妙,要讓其真正實(shí)現(xiàn)自主的為人類服務(wù),可能還需要5年、10年、50年甚至更長。
圖片來自“123rf.com.cn”
過去的事實(shí)證明,人類向來不善于預(yù)測。要么總是高估短期發(fā)展,低估中長期進(jìn)程,要么壓根猜錯(cuò)了方向。
基于自身需求和社會(huì)發(fā)展,人們確信,AI是解決交通問題的終極工具。資本同樣確信這一點(diǎn),到2020年以前,全球AI產(chǎn)業(yè)投資將達(dá)到4000億美元,60%的投資和新創(chuàng)公司誕生在中美兩國。
但投資人已經(jīng)發(fā)現(xiàn),找新項(xiàng)目越來越難,而項(xiàng)目變得昂貴,這是資本泡沫出現(xiàn)的信號。
就短期而言,AI的效能和回報(bào)都被高估了。
作為自動(dòng)駕駛研發(fā)的領(lǐng)先者,谷歌旗下的Waymo正在鳳凰城郊區(qū)部署自動(dòng)駕駛車隊(duì),并已經(jīng)開始收費(fèi)服務(wù)。對于本地智能決策的實(shí)用項(xiàng)目而言,是巨大的階段性成功,盡管服務(wù)區(qū)域和服務(wù)人群都做了精心的限制和挑選。顯然,這是限定場景下的L4級別自動(dòng)駕駛應(yīng)用。
然而,當(dāng)?shù)鼐用駸嶂杂谌⌒aymo的自動(dòng)駕駛車輛。這些白色的克萊斯勒Pacifica在高速路上試圖并線卻總不成功,最后被迫駛下公路;或者在經(jīng)過十字路口時(shí)把車道占住,不敢拐彎,導(dǎo)致追尾。人類司機(jī)不耐煩過于守規(guī)矩的交通參與者,他們粗魯?shù)匕蠢龋静还蹵I是否聽得懂。
Waymo的CEO克拉夫西克則暗示AI的笨拙狀態(tài)還要持續(xù)多年,他認(rèn)為L5級自動(dòng)駕駛的實(shí)用部署可能需要“數(shù)十年”,這和他3年前的樂觀態(tài)度形成鮮明對比。
這多半源于工程師們對AI訓(xùn)練時(shí)的心力交瘁。真實(shí)世界的工況復(fù)雜程度,很難通過固定模型調(diào)參,達(dá)到完全覆蓋的目的。和公眾認(rèn)識的相反,獲取數(shù)據(jù)是容易的。只要法律允許且車主們同意,地球上每天運(yùn)行的十幾億輛汽車,都可以裝上廉價(jià)傳感器,獲取行駛數(shù)據(jù),上傳云端。
如此海量的元數(shù)據(jù),必然存在大量重復(fù)的冗余數(shù)據(jù)。工程師們花了很長時(shí)間,編寫算法,提煉并構(gòu)建對AI訓(xùn)練有最大價(jià)值的數(shù)據(jù)庫(即訓(xùn)練模型)。
不過,數(shù)據(jù)后期的分類標(biāo)定、數(shù)據(jù)質(zhì)量以及算法,存著在很多的不確定因素。而公眾和監(jiān)管機(jī)構(gòu)都堅(jiān)持,自動(dòng)駕駛汽車需要測試數(shù)億至數(shù)千億公里,才能驗(yàn)證它們在減少交通事故方面的可靠性。這無疑加大了AI應(yīng)用在自動(dòng)駕駛的難度。
由于算力的局限,致使AI訓(xùn)練過程變得很長。數(shù)據(jù)量超出硬件承載的上限,AI就無法表現(xiàn)得老練得體。也因?yàn)橥瑯拥脑?,人們必須事先篩選數(shù)據(jù),避免硬件崩盤。
眾所周知,隨著硅基芯片加工極限迫近,單個(gè)芯片的算力提升乏力。摩爾定律不是法律,它只不過是從業(yè)者觀察到芯片業(yè)蓬勃發(fā)展時(shí)期的規(guī)律而已,而這一規(guī)律正在走向終結(jié)。
因?yàn)楣柙拥闹睆绞?.3nm,這是不可逾越的物理限制。而且,門控電路很難控制單個(gè)原子。此時(shí)的量子效應(yīng)不可忽略,電路邏輯從確定狀態(tài)變成概率,芯片邏輯將一塌糊涂。目前人類在水中雕刻硅片的“刀具”是深紫外光——接近X射線的波長,硅加工當(dāng)下的極限是7nm,而提升的終點(diǎn)可能是2-3nm。
既然電路密度提升愈來愈困難,擴(kuò)大面積、增加立體維度,不就仍可以擴(kuò)張電路復(fù)雜度嗎?考慮到能耗帶來的尺寸翹曲和散熱問題,無論二維還是三維擴(kuò)張,都受到嚴(yán)格限制。即便全球頂尖加工能力,硅片面積擴(kuò)張后,成品率也不可避免地急劇下降。
當(dāng)前人類仍在不斷提升算力,靠的是大規(guī)模并聯(lián),多芯片算力協(xié)同的代價(jià),則是數(shù)據(jù)內(nèi)部傳輸?shù)男实拖潞凸募眲∩仙?/p>
2016年戰(zhàn)勝李世石的AlphaGo仍是傳統(tǒng)的馮諾依曼結(jié)構(gòu),配置了1202個(gè)CPU和176個(gè)GPU,功率17萬瓦,下一盤棋電費(fèi)3000美元。而李世石的大腦就算滿負(fù)荷運(yùn)行最多也只20瓦,只夠點(diǎn)亮一盞昏暗的白熾燈。這不是一場公平的決斗。在人腦面前,AI笨拙得驚人,也低效得驚人。
而第二年戰(zhàn)勝柯潔的AlphaGo則采用了4片基于云的TPU,構(gòu)成180TFlops算力(1T哈希率=1萬億次運(yùn)算)。而2018年谷歌推出的TPU3.0,具備100P(1P哈希率=1000萬億次運(yùn)算)算力。作為代價(jià),TPU3.0必須采用水冷機(jī)制。超算的冷卻更需要龐大設(shè)備,微軟的內(nèi)蒂克項(xiàng)目干脆建在蘇格蘭奧克尼群島冰冷的海底。
TPU本質(zhì)上是專用場景的ASIC芯片,對馮諾依曼結(jié)構(gòu)的瓶頸進(jìn)行優(yōu)化,不能處理文本,專門用于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)計(jì)算。計(jì)算密度無法提升的時(shí)候,我們依靠改善架構(gòu),繼續(xù)榨取算力。
但是TPU的體積、功耗和麻煩的冷卻設(shè)備,都注定它不可能充當(dāng)車載本地AI?;诟咚倬W(wǎng)絡(luò)的云端算力,減輕了本地AI的負(fù)擔(dān)。不過,這些提升終有盡頭,而且盡頭近在眼前。
在硅基芯片的潛力挖掘殆盡之前,我們必須找到更強(qiáng)大的算力。量子計(jì)算和化合物半導(dǎo)體、生物計(jì)算都具備替代潛質(zhì)。而大多數(shù)國家資本,正在大規(guī)模地押注量子。但是截至目前,世界上還沒有真正意義上的量子計(jì)算機(jī),也很難估量什么樣的方案能更有效地束縛微觀態(tài)的量子。量子計(jì)算機(jī)的實(shí)用化預(yù)測,從5年到50年不等。
在人們擔(dān)心強(qiáng)AI失控之前,AI本身還未能對算法進(jìn)化做出什么貢獻(xiàn)。算法的巧妙依賴于人腦。對于人類來說,個(gè)體知識體系并不重要,算法的優(yōu)化源自人類經(jīng)驗(yàn)積累。這和芯片電路規(guī)模擴(kuò)張,有異曲同工之妙。在合理功耗下算力足夠強(qiáng),是AI勝任高級別自動(dòng)駕駛的唯一現(xiàn)實(shí)路徑。
在硅基芯片潛力挖掘殆盡之前,探索出新路徑來,決定了AI的未來。這就是我們無法看清未來的原因。