被寫入政府工作報(bào)告,人工智能讓天下無拐?
執(zhí)牛耳網(wǎng)編輯Aira 發(fā)表于 2017-03-06 18:22
閱讀數(shù): 12702
時(shí)至今日,你也很難估量2011年——微博上一個(gè)黃金時(shí)期,社科院農(nóng)村發(fā)展研究所教授于建嶸先生發(fā)起的“隨手拍照解救乞討兒”活動產(chǎn)生的社會影響力。盡管轟轟烈烈的“人人拍照挽救拐賣兒童”因陷入某種狂熱而遭到質(zhì)疑,但公眾對這一事件的憤恨,對離散家庭的憐憫,依舊持續(xù)產(chǎn)生了在其他事件上并不常見的共情效應(yīng)——為數(shù)不多的社會題材院線電影,甚至有《失孤》和《親愛的》兩部與此相關(guān)。
不過現(xiàn)實(shí)是,由于查找與辨認(rèn)兒童唯有靠肉眼并不擅長的照片對比,準(zhǔn)確率和效率上都非常有限,仍未從根本上改善這一社會悲劇。也因此,幾乎每年兩會都有人大代表提出與走失兒童相關(guān)議案,譬如去年就有代表建議:兒童出生時(shí)由政府免費(fèi)采集DNA,且所有孩子上戶口時(shí)必須核對DNA信息。然而經(jīng)濟(jì)學(xué)常識是,美好愿景與“社會成本”之間存在鴻溝,通過DNA比對需要巨大的技術(shù)成本。
一年之后,今年提出議案的換成了科技大佬李彥宏。3月3日,李彥宏在全國政協(xié)十二屆五次會議提案:利用已經(jīng)成熟的人工智能和大數(shù)據(jù)技術(shù),幫助解決走失兒童問題。
事實(shí)上,當(dāng)人工智能普遍被產(chǎn)業(yè)界視作未來社會下一代基礎(chǔ)設(shè)施,與之相關(guān)的提案當(dāng)然不只李彥宏一份,復(fù)星集團(tuán)董事長郭廣昌也提案,希望更多醫(yī)療健康行業(yè)與人工智能技術(shù)相結(jié)合——而讓李彥宏和郭廣昌興奮的是,就在3月5日上午,第十二屆全國人民代表大會第五次會議在人民大會堂開幕,“人工智能”首次被寫入全國政府工作報(bào)告。
當(dāng)然,說回李彥宏的這份提案。其實(shí)多年來,輿論強(qiáng)大的共情作用讓不少科技企業(yè)都試圖改善這一現(xiàn)象:譬如兩年前頗為火爆的兒童智能穿戴設(shè)備,但遺憾的是,后來由于輻射高,續(xù)航差,GPS 誤差高等原因,被寄予厚望的可穿戴逐漸淪為一時(shí)玩物;此外微博也曾推出過“LBS地域情景化網(wǎng)格系統(tǒng)”,利用用戶位置信息有所作為。
與上述從“邊緣性”突圍的方式不同,李彥宏祭出的手段是過去一年多次提及的人工智能,在他看來,“近年來人工智能和大數(shù)據(jù)技術(shù)不斷完善,應(yīng)用日趨成熟,有望進(jìn)一步促進(jìn)兒童走失案件的偵破。一方面,人臉識別能夠提升圖像偵查效率,盡早鎖定失蹤兒童或涉案人員。另一方面,人臉識別能夠?qū)崿F(xiàn)海量人臉數(shù)據(jù)的跨年齡比對,幫助偵破兒童走失積案?!?/p>
于是問題的關(guān)鍵轉(zhuǎn)向在公眾一端熟悉又陌生的詞匯:人臉識別。今天不妨從技術(shù)視角,分析一下李彥宏這一提案的理論基礎(chǔ)。畢竟,相較于DNA,“人臉”是大眾更熟悉且成本低得多的識別對象。
人類思維VS機(jī)器思維
進(jìn)化心理學(xué)告訴我們:由于祖先族群內(nèi)原始的協(xié)作需求——以及識別“異己者”和“不合作者”的本能,人類大腦從上百萬年前就演化出了識別人臉的能力。而也正由于這上百萬年“時(shí)間差”造成的演化沉淀,識別他人面孔歸屬于大腦應(yīng)激反應(yīng)的所謂快系統(tǒng),或者說直覺——不過,機(jī)器世界里從來沒有“直覺”二字,有的只是算法和數(shù)據(jù)。
這亦是人臉識別技術(shù)難度所在。不同于一般圖像識別,人類臉部結(jié)構(gòu)存在極大相似性;且表情易變(人類究竟有多少種表情?我還沒看到特別權(quán)威的數(shù)字,但至少比“表情包”豐富得多);另外,不同的觀察角度,光照條件,遮蓋物(口罩,墨鏡,頭發(fā),胡須等等)都會增加機(jī)器識別難度;更何況喪心病狂的人類居然還通過整容和P圖等行為擾亂機(jī)器判斷……
不過即便如此,當(dāng)如今人工智能已發(fā)展到“只要人類正常情況下1秒就能做的事,它幾乎也能做到”的地步,人臉識別的技術(shù)進(jìn)步也令人欣喜。
顧名思義,作為一種集成了機(jī)器學(xué)習(xí),模型理論,專家系統(tǒng),視頻圖像等多種技術(shù)的綜合實(shí)現(xiàn)方式,人臉識別可以實(shí)現(xiàn)人臉檢測,對比以及查找。而這一輪人臉識別精準(zhǔn)性的提升,無疑受益于在海量數(shù)據(jù)加持下的深度學(xué)習(xí)(作為一次算法革命,深度學(xué)習(xí)以一種簡練的網(wǎng)絡(luò)模型解決了過往印象中極為復(fù)雜的思維體系):換句話說,為了在“茫茫人臉”中認(rèn)出特定面孔,機(jī)器需要先自己“記住”上億張人臉。
這就得說到機(jī)器思維的底層邏輯。與人類思維試圖將整個(gè)世界簡化和抽象理解不同(大腦帶寬有限,人類對因果關(guān)系和“貼標(biāo)簽”的熱衷皆因于此),機(jī)器思維走在了奧卡姆剃刀原則的反面——人工智能不會將世界簡化,而是從復(fù)雜信息中以自己的方式進(jìn)行篩選。
舉個(gè)例子,在那期被廣泛熱議的《最強(qiáng)大腦》人機(jī)大戰(zhàn)中,人工智能與世界記憶大師王峰通過分析照片中出現(xiàn)的幼年人臉,識別出現(xiàn)場20年后的成年人,人工智能贏了,但要知道,截止這場比賽前,機(jī)器已動用大概200萬人次,近2億張照片作為訓(xùn)練樣本數(shù)據(jù),通過提取人臉中相對穩(wěn)定和細(xì)微的特征,完成年齡跨度較大的人像高精度比對。
從“競賽”角度,人類與機(jī)器并不在同一起跑線,但也就在那次節(jié)目上,初為人母的章子怡女士感慨道:“我們有很多的失蹤兒童,他成長了之后可能連父母都認(rèn)不出來他的樣子,但小度可以幫我們辨別出來,所以小度要為人類作出更多貢獻(xiàn)?!?/p>
不知道李彥宏的兩會提案,是否與此有關(guān)。
人臉識別技術(shù)路徑
在我看來,已頗為成熟的人臉識別技術(shù),倒不失為一次理解機(jī)器思維的好機(jī)會。
事實(shí)上,人臉識別的實(shí)現(xiàn)大體可分為四步。第一步當(dāng)然是人臉檢測:根據(jù)眼睛,眉毛,嘴巴,鼻子等器官特征和相互幾何位置關(guān)系檢測人臉。第二步則是人臉圖像預(yù)處理:如前所述,原始圖像由于受各種條件的限制和干擾,很多時(shí)候無法直接使用,必須在早期階段對其進(jìn)行灰度校正,噪聲過濾等圖像預(yù)處理。進(jìn)一步剖析的話,這種預(yù)處理主要包括人臉對準(zhǔn)(得到人臉位置端正的人臉圖像),圖像增強(qiáng)(改善圖像質(zhì)量,在視覺上更清晰,且讓圖像更利于計(jì)算機(jī)的處理與識別)以及歸一化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像)等工作。
人臉識別的第三步就是臉圖像特征提取——這一步是針對人臉某些特征進(jìn)行的,也是對人臉進(jìn)行特征建模的過程。最后一步,即是輸出結(jié)果的匹配與識別:將待識別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據(jù)相似程度對人臉的身份信息進(jìn)行判斷。
以上是適用于所有識別用途的理論路徑,但李彥宏在提案中涉及的場景則更為復(fù)雜:“可能孩子是在很小的時(shí)候走失的,但他再進(jìn)入公眾視線可能已經(jīng)上小學(xué)了——比如辦學(xué)生證的時(shí)候需要拍照片,這種情況下通過人工智能的比對,就有可能比以前更加高效的幫助有關(guān)部門和家庭找到走失兒童?!?/p>
就像章子怡冀望的那樣,對比走失兒童是“跨年齡人臉識別”技術(shù)最具社會價(jià)值的實(shí)現(xiàn)場景。但在影響人臉識別率的所有因素上,時(shí)間往往是最難對抗的部分,原因之一是跨年齡識別中類內(nèi)變化通常會大于類間變化;另外,跨年齡訓(xùn)練數(shù)據(jù)難尋,若沒有海量數(shù)據(jù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)便很難學(xué)習(xí)到跨年齡的類內(nèi)和類間變化。不過百度也提出了解決方案:針對第一點(diǎn),他們選擇用度量學(xué)習(xí)的方法,通過學(xué)習(xí)一個(gè)非線性投影函數(shù),把圖像空間投影到特征空間中,在這個(gè)特征空間里跨年齡的同一個(gè)人的兩張人臉距離會比不同人的相似年齡的兩張人臉的距離要小;而針對第二點(diǎn),考慮到跨年齡人臉的稀缺性,通過一個(gè)用大規(guī)模人臉數(shù)據(jù)訓(xùn)練好的模型作為底座,然后用跨年齡數(shù)據(jù)對他做更新。而將上述兩點(diǎn)結(jié)合,通過端到端的訓(xùn)練,即可以大幅提升跨年齡識別的識別率。
這也正是李彥宏此次提案的理論基礎(chǔ)。
培育共識
事實(shí)上,在準(zhǔn)備兩會提案時(shí),李彥宏已非常確信技術(shù)本身的成熟度。但要知道,讓技術(shù)落地從來都是檢驗(yàn)技術(shù)的唯一標(biāo)準(zhǔn)。其實(shí)人臉識別已廣泛應(yīng)用于諸多領(lǐng)域,最直接的例子是,早在提案前,百度人臉識別就已經(jīng)用于尋人平臺上,平臺現(xiàn)對接民政部全國救助尋親網(wǎng)中近3萬條走失人口信息。
不過,歷史經(jīng)驗(yàn)是:讓社會系統(tǒng)向更美好的方向演進(jìn),技術(shù)之外,還需要某種合力。通過人工智能尋找走失兒童亦不例外,它需要與相關(guān)部門相互嵌合,根據(jù)場景不斷調(diào)優(yōu)。也因?yàn)榇?,李彥宏在提案中的具體建議包括:建立適用于搜尋走失兒童的人臉識別模型;建立覆蓋全國的走失兒童數(shù)據(jù)庫;將人臉識別技術(shù)與治安和交通監(jiān)控系統(tǒng)相結(jié)合等。
在我看來,即便提案延緩落地,也不失為一次在整個(gè)社會范疇孕育共識的機(jī)會,要知道,人工智能會成為未來服務(wù)公共事務(wù)的重要方式,但來自政府的頂層支持也是讓作為社會基礎(chǔ)設(shè)施的人工智能盡早落地的途徑。
如今,人工智能仿佛一個(gè)植入系統(tǒng),已經(jīng)改變了購物,金融,媒體,交通,外賣等生活各個(gè)日常片段,并期待自己如百年前的電力系統(tǒng)一般為人類延伸出更多的可能。所以你完全可以想象如下場景:《失孤》和《親愛的》中的父母不再通過持續(xù)多年的滿城尋覓,而是到公安機(jī)關(guān)錄入孩子照片,機(jī)器通過數(shù)據(jù)庫對比,尋找到匹配對象,以更能燃起希望的方式,讓故事以相對完滿的結(jié)局收場。
0條評論