羅征:騰訊為什么要搞算法大賽?
執(zhí)牛耳網(wǎng)編輯Aira 發(fā)表于 2017-08-08 18:13
閱讀數(shù): 3533
人工智能已經(jīng)成為重塑所有行業(yè)的生產(chǎn)效率的利器。在一系列讓人“瞠目結(jié)舌”的戰(zhàn)果之后,隨之而來的是技術(shù)、機(jī)器學(xué)習(xí)以及一切“朝AI進(jìn)化”的熱潮快速來臨。
近年來不少互聯(lián)網(wǎng)企業(yè)都在積極舉辦算法比賽正是“AI熱”的一個縮影,比賽并非唯一目的,很多公司真正的愿望是接觸到更多的算法人才,這其中就包括了諸如騰訊、京東、滴滴、阿里巴巴等中國互聯(lián)網(wǎng)領(lǐng)域的佼佼者。
不久前,騰訊首屆高校算法大賽剛落下帷幕,來自南京大學(xué)的三位學(xué)子拿下了本屆大賽的冠軍,并贏得了高達(dá)30萬元的冠軍獎金。為什么騰訊社交廣告要下大力氣舉辦算法比賽?機(jī)器學(xué)習(xí)對于廣告的意義在哪里?
Morketing對話羅征,從一場比賽,了解他對人工智能的態(tài)度。
從轉(zhuǎn)化入題
此次算法大賽的命題是“移動APP廣告轉(zhuǎn)化率預(yù)估”,題目并沒有套上一個與AI有關(guān)的大帽子,而是著眼在了非常實際的問題上。在羅征看來,這個命題既有難度,又十分貼近社交廣告最核心的部分:轉(zhuǎn)化率優(yōu)化。“轉(zhuǎn)化率一直是廣告主最關(guān)心的,他們花錢買點擊和曝光,自然希望了解可以帶來多大價值。這就是轉(zhuǎn)化。”
從轉(zhuǎn)化率入手,是因為羅征希望能讓參賽的學(xué)生們不光在做算法,同時也能去更深入的了解計算廣告,特別是社交廣告領(lǐng)域中存在的現(xiàn)實問題。在與幾個奪得優(yōu)異名次團(tuán)隊的交流中,羅征明顯地感到他們不止是“跑了些算法”這么簡單。
“如果不了解轉(zhuǎn)化的優(yōu)化是為了什么,只是研究機(jī)器學(xué)習(xí),基本沒有可能贏得比賽,獲獎的前幾名團(tuán)隊都對騰訊社交廣告的業(yè)務(wù)和邏輯做了深度的思考?!绷_征說,比賽不僅訓(xùn)練了他們機(jī)器學(xué)習(xí)的能力,更多的是把算法落地在廣告領(lǐng)域中的實際應(yīng)用。
騰訊社交廣告APP推廣成本優(yōu)化專屬解決方案oCPA
來自冠軍團(tuán)隊“nju-newbie”的成員在接受采訪時也談到:“本次賽題的目標(biāo)是轉(zhuǎn)化率預(yù)測,相比于一般的點擊率預(yù)測,轉(zhuǎn)化率預(yù)測更困難,用戶數(shù)據(jù)更稀疏,影響轉(zhuǎn)化率的因素更多,這都是對于參賽選手的挑戰(zhàn)?!?/p>
在騰訊社交廣告的體系中,最早應(yīng)用人工智能理念和方法的就包括轉(zhuǎn)化率預(yù)估、點擊率預(yù)估和廣告審核等多個方面。在數(shù)據(jù)挖掘中,也會利用到AI,例如對用戶商業(yè)興趣、行為和生活狀態(tài)等進(jìn)行判斷時,機(jī)器學(xué)習(xí)是最好的選擇,可以避免人工參與導(dǎo)致的隱私問題。
數(shù)據(jù),是這次比賽中讓不少參賽團(tuán)隊印象深刻的一面,幾位受訪的參賽學(xué)生都談到這次比賽的數(shù)據(jù)規(guī)模是他們見過的比賽中體量最大的一次。數(shù)據(jù)規(guī)模,從很大程度上激發(fā)他們使用了不少之前沒有探索過的模型和技巧。獲得比賽亞軍的團(tuán)隊Raymone在接受采訪時說:這次比賽的數(shù)據(jù)量是所有團(tuán)隊幾乎都要面對的問題,很多小伙伴在此之前都很少有機(jī)會接觸到幾十GB級別的數(shù)據(jù),在機(jī)器性能存在瓶頸的情況下,如何高效的處理并構(gòu)建模型是非??简?zāi)芰Φ囊幻妗?/p>
數(shù)據(jù)體量既是騰訊的優(yōu)勢之一,同樣也是考點。羅征談到當(dāng)數(shù)據(jù)規(guī)模越來越大,對模型和算法的要求就不再局限于“做得好不好”,還要考慮到工程方面“做得快不快”。如今AI的基礎(chǔ)研究已經(jīng)不只是追求結(jié)果,也要追求速度和資源利用率。
這一點也體現(xiàn)了不少團(tuán)隊的解決方案中,許多隊伍都強(qiáng)調(diào)在進(jìn)行轉(zhuǎn)化率預(yù)估前,對數(shù)據(jù)進(jìn)行預(yù)處理,去噪以及特征提取的重要性。
今年比賽的高校學(xué)生讓羅征印象深刻,除了感受到他們認(rèn)真的投入,對于算法思考的質(zhì)量也出乎意料的高水平,“參賽學(xué)生們的一些想法和思路,確實值得我們內(nèi)部去借鑒和嘗試”。
產(chǎn)品驅(qū)動下的智能時代
近幾年來,AI的基礎(chǔ)投入越來越多,算法的突破也越來越多。深度學(xué)習(xí)和各種技巧、能力,讓AI的應(yīng)用覆蓋面越來越大。為了更好的應(yīng)用AI,羅征和他的團(tuán)隊也會做一些研究性的投入,目的是利用AI來增加廣告效率,增加廣告主的利益。
這在之前是很難想象的,羅征回憶在自己讀書的那個時代,一項技術(shù)從科研到工業(yè)界嘗試,最后變成產(chǎn)品實際應(yīng)用往往需要5到10年的時間。而在互聯(lián)網(wǎng)公司的時代,這一速度被迅速加快。
據(jù)悉,如今很多新興的互聯(lián)網(wǎng)公司例如Google和Facebook都已經(jīng)不再像IBM和AT&T那樣設(shè)立大型研究院。許多公司的研究院專精于最前沿的基礎(chǔ)研究,比如騰訊的AI-Lab實驗室,其發(fā)展目標(biāo)是“學(xué)術(shù)有影響,工業(yè)有產(chǎn)出”,因此專注于基礎(chǔ)研究和應(yīng)用探索結(jié)合。而另外一個人工智能的研發(fā)驅(qū)動力已經(jīng)從“學(xué)術(shù)研發(fā)”轉(zhuǎn)向產(chǎn)品驅(qū)動。
“以前的技術(shù)研發(fā),先是學(xué)術(shù)界出來很好玩的東西,然后研究下有什么應(yīng)用價值,再去落地到產(chǎn)品層面,以專利的形式賣給大公司;如今,很多時候是產(chǎn)品團(tuán)隊要提升效率,需要這個功能,反推研究方向?!边@樣的變化讓技術(shù)從理論落地到產(chǎn)品的速度大大加快,周期變得很短。羅征提到在算法大賽中,一些參賽選手直接參考了業(yè)界的一些前沿論文,并直接應(yīng)用在比賽當(dāng)中,這么快的反饋周期,是10幾年前所不可想的。
然而時間的縮短,并不意味著一切都要朝“AI看齊”。“AI是一個很重要的提升效率的手段,但不是目標(biāo)。我們不是為了做AI而做AI。作為一個企業(yè)的CMO來說,最重要的是結(jié)果,我們可以說使用了AI的技巧,提升了廣告的效果,但最重要的還是轉(zhuǎn)化結(jié)果?!?/p>
AI在羅征看來是一個工具,能夠幫助實現(xiàn)一些人做不到的事情。落地在廣告領(lǐng)域中,一是將人力所能做的事情自動化,比如在廣告審核中引入AI技術(shù),將某些步驟自動化處理從而起到對效率提升的作用;另一種是做一些人做不到的事情,比如在轉(zhuǎn)化率預(yù)估中,數(shù)據(jù)的體量可能包含了幾億用戶過去幾個月的所有點擊,所有轉(zhuǎn)化,體量非常之巨大。要將他們總結(jié)為一個模型,得出有效的判斷,是人力所不能及的,這也是機(jī)器學(xué)習(xí)等AI技術(shù)在廣告領(lǐng)域中最為關(guān)鍵的應(yīng)用。
Morketing觀察到,近年來AI行業(yè)的發(fā)展速度驚人,許多互聯(lián)網(wǎng)的一線企業(yè)都在加大投入,并且以開源的姿態(tài)鼓勵更多的開發(fā)者進(jìn)入AI的領(lǐng)域中。Google的Tenser Flow計劃以及百度的無人車項目等都把開放平臺作為主打。整個業(yè)界投入的加大,對于羅征所在的產(chǎn)品應(yīng)用層來說,無疑是件好事。
人工智能的現(xiàn)實瓶頸
盡管AI正處于風(fēng)口,但羅征認(rèn)為人工智能的應(yīng)用目前有兩大瓶頸。
想要把AI做的更好,人才儲備是第一位的。據(jù)媒體報道,人工智能在人才方面極為缺乏,例如為了給創(chuàng)新工場AI工程院搶人,李開復(fù)曾親自跑了多場高校招聘會。而阿里云的人工智能科學(xué)家閔萬里表示,團(tuán)隊里很多年輕技術(shù)人員都被挖走了。
未來人才爭奪戰(zhàn)可能會更加激烈,因為越來越多的公司開始成立人工智能研究部門。據(jù)悉,微軟AI研究院曝光,位于微軟雷德蒙德總部,擁有100多名來自各個AI研究子領(lǐng)域的科學(xué)家,包括認(rèn)知、學(xué)習(xí)、推理以及自然語言處理。網(wǎng)易也在不久前設(shè)立了人工智能事業(yè)部。
與高校加深合作,從高校層面就開始招攬人才也是這次“算法大賽”的目標(biāo)之一,羅征坦言人才的供應(yīng)永遠(yuǎn)是不足的,每年這個領(lǐng)域的畢業(yè)的人才數(shù)量有限。招兵買馬是一個需要持續(xù)下去的工作。
而另一個AI的門檻,更多的來自于企業(yè)自身的限制。例如在羅征所在的部門,出于對用戶隱私保密的負(fù)責(zé),所有的機(jī)器學(xué)習(xí)算法所處理的數(shù)據(jù)均不會利用任何的聊天記錄,這是騰訊為自己定下的規(guī)則。
“雖然騰訊的數(shù)據(jù)很豐富,但是對于垂直行業(yè)的理解,還是有些合作伙伴比我們更強(qiáng)的,比如說我們跟易車一起探討汽車類的用戶,跟京東會探討電商類的,美團(tuán)點評就探討O2O類的。他們對用戶在垂直行業(yè)上面的行為興趣理解更深入。我覺得下來更進(jìn)一步的突破點,主要就是結(jié)合一些行業(yè)數(shù)據(jù),如何與社交數(shù)據(jù)結(jié)合的更好。”
騰訊社交廣告算法大賽由騰訊社交廣告攜手騰訊數(shù)據(jù)平臺部、騰訊高校合作、騰訊云、應(yīng)用寶、騰訊招聘、T派校園等各大資源與平臺聯(lián)合舉辦,旨在加速推進(jìn)算法優(yōu)化,持續(xù)提高廣告的效率和投入產(chǎn)出比,為數(shù)字營銷提供完整、精準(zhǔn)的解決方案。
1、執(zhí)牛耳新媒體原創(chuàng)文章及翻譯文章未經(jīng)授權(quán)轉(zhuǎn)載必究,如需轉(zhuǎn)載請聯(lián)系官方微信號進(jìn)行授權(quán)。
2、轉(zhuǎn)載時須在文章頭部明確注明出處、保留官方微信、作者和原文超鏈接。如轉(zhuǎn)自執(zhí)牛耳新媒體(微信號:zhiniuerall)字樣。
3.本網(wǎng)站所轉(zhuǎn)載的文章資料、圖片、圖表、數(shù)據(jù)僅供參考使用,所刊登的轉(zhuǎn)載信息均為信息來源方與的個人意見及表達(dá)方式,和本網(wǎng)站無任何關(guān)系,如有侵權(quán)或違法行為應(yīng)由其相關(guān)信息來源方承擔(dān)全部責(zé)任。
0條評論