阿里媽媽圖像識別刷新世界最好成績,一年屏蔽4600萬惡意推廣
執(zhí)牛耳 發(fā)表于 2016-06-01 12:35
閱讀數: 14137
圖. ICDAR Robust Reading Challenge 1end-to-end官方成績
日前,阿里媽媽圖像團隊的OCR(圖中文字識別)技術刷新了ICDAR Robust Reading競賽數據集的全球最好成績,并大幅超越第二名。RobustReading競賽是當前OCR技術領域全球最具影響力的比賽。這也是繼阿里巴巴圖像搜索領軍人物華先勝獲得ACM(美國計算機協會)“杰出科學家”稱號之后,阿里的圖像識別技術再一次登上國際頂尖舞臺。
借助這一領先的OCR技術,阿里媽媽圖像團隊能夠以95%的超高準確率識別圖中違規(guī)文字信息,有效過濾商家惡意推廣,維護消費者權益。2015年,阿里媽媽累計屏蔽了4600萬條惡意推廣。
OCR是計算機視覺領域的經典問題,長久以來,一直受到學術界和工業(yè)界的持續(xù)關注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯網公司,以及商湯科技、曠視科技(擁有Face++、Image++)等計算機視覺技術創(chuàng)業(yè)公司,都在OCR技術上耕耘多年。隨著技術不斷成熟,OCR也開始在互聯網及其他行業(yè)逐步上線使用。
據阿里媽媽定向算法技術負責人蓋坤介紹,在阿里巴巴平臺上營銷創(chuàng)意、商品等均是以圖片形式展示,圖像技術是理解這些信息的重要手段。同時,也有不良商家在圖片中內嵌一些違規(guī)的信息達到其惡意推廣的目的,圖片內文字違規(guī)是比例相當大的一類,而傳統監(jiān)控手段多以人工肉眼來審核,費時費力,尤其是隨著圖片數量越來越大,這幾乎已成為不可完成的任務。針對這一強烈需求,從2014年開始,阿里媽媽圖像團隊開始重點攻堅OCR技術,通過機器視覺的方式從圖片中識別出文字,從而鑒別出違規(guī)的文案信息。
對惡意推廣的定義,蓋坤表示,一方面依據國家相關法律法規(guī),對于違禁品、色情信息、封建迷信、假冒偽劣、減肥豐胸、夸大虛假等違規(guī)類型進行不同程度的處罰和管理,另一方面在法規(guī)之外平臺有著更高要求,對損害消費者利益或進行不正當競爭的推廣類型積極嘗試進行管控。其中,與消費者關系最為密切的假冒偽劣單項違規(guī)類型,被阿里媽媽作為重點審查對象。
相對其他限定場景OCR應用相比,阿里媽媽要處理的創(chuàng)意圖片和商品圖片上的文字字體、色彩更加多樣,文字布局更加靈活,背景包括各種商品、布景或自然場景,蘊含各種復雜紋理,給識別問題帶來了更大的挑戰(zhàn)。蓋坤介紹,在技術路線上,相比于傳統方法,拋棄了圖像預處理、字符分割等流程,采用了多個深度神經網絡和語言模型相結合的方法來組成完整的OCR系統。針對復雜的場景信息,將LSTM(長短時記憶)技術成功應用到建模中去,大大提高識別的準確率。
據悉,現在基于OCR文字識別實時審核已覆蓋整個阿里媽媽業(yè)務,每天處理圖片近千萬張,自動反饋疑似違規(guī)圖片準確率達95%以上;同時將圖文審核風險發(fā)現時間從“天”降低到“秒”級。數據顯示,2015年阿里媽媽累計屏蔽了4600萬條惡意推廣,有效凈化了互聯網營銷環(huán)境。
除OCR過濾惡意推廣以外,計算機視覺技術在阿里巴巴集團內部已經獲得廣泛使用,比如手淘的“拍立淘”產品,通過手機拍照即可搜索相似商品,2015年雙11當天,千萬消費者使用了“拍立淘”功能,創(chuàng)造了超過數千萬元的銷售額。另外,在商品圖片版權保護、鑒黃等場景也都引入了計算機視覺技術。
2015年12月25日全面上線。目標:打造全球數字營銷技術領域首席媒體平臺,成為中國乃至全球數字營銷內容聚合門戶。目前團隊積極依托專業(yè)素養(yǎng),全力為數字營銷領域從業(yè)者搭建有質感的交流空間。感謝相伴!
文章:3112
0條評論