閱讀數(shù): 3620

人工智能已經成為重塑所有行業(yè)的生產效率的利器。在一系列讓人“瞠目結舌”的戰(zhàn)果之后,隨之而來的是技術、機器學習以及一切“朝AI進化”的熱潮快速來臨。
近年來不少互聯(lián)網企業(yè)都在積極舉辦算法比賽正是“AI熱”的一個縮影,比賽并非唯一目的,很多公司真正的愿望是接觸到更多的算法人才,這其中就包括了諸如騰訊、京東、滴滴、阿里巴巴等中國互聯(lián)網領域的佼佼者。
不久前,騰訊首屆高校算法大賽剛落下帷幕,來自南京大學的三位學子拿下了本屆大賽的冠軍,并贏得了高達30萬元的冠軍獎金。為什么騰訊社交廣告要下大力氣舉辦算法比賽?機器學習對于廣告的意義在哪里?
Morketing對話羅征,從一場比賽,了解他對人工智能的態(tài)度。
從轉化入題
此次算法大賽的命題是“移動APP廣告轉化率預估”,題目并沒有套上一個與AI有關的大帽子,而是著眼在了非常實際的問題上。在羅征看來,這個命題既有難度,又十分貼近社交廣告最核心的部分:轉化率優(yōu)化。“轉化率一直是廣告主最關心的,他們花錢買點擊和曝光,自然希望了解可以帶來多大價值。這就是轉化?!?/p>
從轉化率入手,是因為羅征希望能讓參賽的學生們不光在做算法,同時也能去更深入的了解計算廣告,特別是社交廣告領域中存在的現(xiàn)實問題。在與幾個奪得優(yōu)異名次團隊的交流中,羅征明顯地感到他們不止是“跑了些算法”這么簡單。
“如果不了解轉化的優(yōu)化是為了什么,只是研究機器學習,基本沒有可能贏得比賽,獲獎的前幾名團隊都對騰訊社交廣告的業(yè)務和邏輯做了深度的思考。”羅征說,比賽不僅訓練了他們機器學習的能力,更多的是把算法落地在廣告領域中的實際應用。

騰訊社交廣告APP推廣成本優(yōu)化專屬解決方案oCPA
來自冠軍團隊“nju-newbie”的成員在接受采訪時也談到:“本次賽題的目標是轉化率預測,相比于一般的點擊率預測,轉化率預測更困難,用戶數(shù)據(jù)更稀疏,影響轉化率的因素更多,這都是對于參賽選手的挑戰(zhàn)?!?/p>
在騰訊社交廣告的體系中,最早應用人工智能理念和方法的就包括轉化率預估、點擊率預估和廣告審核等多個方面。在數(shù)據(jù)挖掘中,也會利用到AI,例如對用戶商業(yè)興趣、行為和生活狀態(tài)等進行判斷時,機器學習是最好的選擇,可以避免人工參與導致的隱私問題。
數(shù)據(jù),是這次比賽中讓不少參賽團隊印象深刻的一面,幾位受訪的參賽學生都談到這次比賽的數(shù)據(jù)規(guī)模是他們見過的比賽中體量最大的一次。數(shù)據(jù)規(guī)模,從很大程度上激發(fā)他們使用了不少之前沒有探索過的模型和技巧。獲得比賽亞軍的團隊Raymone在接受采訪時說:這次比賽的數(shù)據(jù)量是所有團隊幾乎都要面對的問題,很多小伙伴在此之前都很少有機會接觸到幾十GB級別的數(shù)據(jù),在機器性能存在瓶頸的情況下,如何高效的處理并構建模型是非??简災芰Φ囊幻妗?/p>
數(shù)據(jù)體量既是騰訊的優(yōu)勢之一,同樣也是考點。羅征談到當數(shù)據(jù)規(guī)模越來越大,對模型和算法的要求就不再局限于“做得好不好”,還要考慮到工程方面“做得快不快”。如今AI的基礎研究已經不只是追求結果,也要追求速度和資源利用率。
這一點也體現(xiàn)了不少團隊的解決方案中,許多隊伍都強調在進行轉化率預估前,對數(shù)據(jù)進行預處理,去噪以及特征提取的重要性。
今年比賽的高校學生讓羅征印象深刻,除了感受到他們認真的投入,對于算法思考的質量也出乎意料的高水平,“參賽學生們的一些想法和思路,確實值得我們內部去借鑒和嘗試”。
產品驅動下的智能時代
近幾年來,AI的基礎投入越來越多,算法的突破也越來越多。深度學習和各種技巧、能力,讓AI的應用覆蓋面越來越大。為了更好的應用AI,羅征和他的團隊也會做一些研究性的投入,目的是利用AI來增加廣告效率,增加廣告主的利益。
這在之前是很難想象的,羅征回憶在自己讀書的那個時代,一項技術從科研到工業(yè)界嘗試,最后變成產品實際應用往往需要5到10年的時間。而在互聯(lián)網公司的時代,這一速度被迅速加快。
據(jù)悉,如今很多新興的互聯(lián)網公司例如Google和Facebook都已經不再像IBM和AT&T那樣設立大型研究院。許多公司的研究院專精于最前沿的基礎研究,比如騰訊的AI-Lab實驗室,其發(fā)展目標是“學術有影響,工業(yè)有產出”,因此專注于基礎研究和應用探索結合。而另外一個人工智能的研發(fā)驅動力已經從“學術研發(fā)”轉向產品驅動。
“以前的技術研發(fā),先是學術界出來很好玩的東西,然后研究下有什么應用價值,再去落地到產品層面,以專利的形式賣給大公司;如今,很多時候是產品團隊要提升效率,需要這個功能,反推研究方向。”這樣的變化讓技術從理論落地到產品的速度大大加快,周期變得很短。羅征提到在算法大賽中,一些參賽選手直接參考了業(yè)界的一些前沿論文,并直接應用在比賽當中,這么快的反饋周期,是10幾年前所不可想的。
然而時間的縮短,并不意味著一切都要朝“AI看齊”?!癆I是一個很重要的提升效率的手段,但不是目標。我們不是為了做AI而做AI。作為一個企業(yè)的CMO來說,最重要的是結果,我們可以說使用了AI的技巧,提升了廣告的效果,但最重要的還是轉化結果。”
AI在羅征看來是一個工具,能夠幫助實現(xiàn)一些人做不到的事情。落地在廣告領域中,一是將人力所能做的事情自動化,比如在廣告審核中引入AI技術,將某些步驟自動化處理從而起到對效率提升的作用;另一種是做一些人做不到的事情,比如在轉化率預估中,數(shù)據(jù)的體量可能包含了幾億用戶過去幾個月的所有點擊,所有轉化,體量非常之巨大。要將他們總結為一個模型,得出有效的判斷,是人力所不能及的,這也是機器學習等AI技術在廣告領域中最為關鍵的應用。
Morketing觀察到,近年來AI行業(yè)的發(fā)展速度驚人,許多互聯(lián)網的一線企業(yè)都在加大投入,并且以開源的姿態(tài)鼓勵更多的開發(fā)者進入AI的領域中。Google的Tenser Flow計劃以及百度的無人車項目等都把開放平臺作為主打。整個業(yè)界投入的加大,對于羅征所在的產品應用層來說,無疑是件好事。
人工智能的現(xiàn)實瓶頸
盡管AI正處于風口,但羅征認為人工智能的應用目前有兩大瓶頸。
想要把AI做的更好,人才儲備是第一位的。據(jù)媒體報道,人工智能在人才方面極為缺乏,例如為了給創(chuàng)新工場AI工程院搶人,李開復曾親自跑了多場高校招聘會。而阿里云的人工智能科學家閔萬里表示,團隊里很多年輕技術人員都被挖走了。
未來人才爭奪戰(zhàn)可能會更加激烈,因為越來越多的公司開始成立人工智能研究部門。據(jù)悉,微軟AI研究院曝光,位于微軟雷德蒙德總部,擁有100多名來自各個AI研究子領域的科學家,包括認知、學習、推理以及自然語言處理。網易也在不久前設立了人工智能事業(yè)部。
與高校加深合作,從高校層面就開始招攬人才也是這次“算法大賽”的目標之一,羅征坦言人才的供應永遠是不足的,每年這個領域的畢業(yè)的人才數(shù)量有限。招兵買馬是一個需要持續(xù)下去的工作。
而另一個AI的門檻,更多的來自于企業(yè)自身的限制。例如在羅征所在的部門,出于對用戶隱私保密的負責,所有的機器學習算法所處理的數(shù)據(jù)均不會利用任何的聊天記錄,這是騰訊為自己定下的規(guī)則。
“雖然騰訊的數(shù)據(jù)很豐富,但是對于垂直行業(yè)的理解,還是有些合作伙伴比我們更強的,比如說我們跟易車一起探討汽車類的用戶,跟京東會探討電商類的,美團點評就探討O2O類的。他們對用戶在垂直行業(yè)上面的行為興趣理解更深入。我覺得下來更進一步的突破點,主要就是結合一些行業(yè)數(shù)據(jù),如何與社交數(shù)據(jù)結合的更好。”
騰訊社交廣告算法大賽由騰訊社交廣告攜手騰訊數(shù)據(jù)平臺部、騰訊高校合作、騰訊云、應用寶、騰訊招聘、T派校園等各大資源與平臺聯(lián)合舉辦,旨在加速推進算法優(yōu)化,持續(xù)提高廣告的效率和投入產出比,為數(shù)字營銷提供完整、精準的解決方案。
1、執(zhí)牛耳新媒體原創(chuàng)文章及翻譯文章未經授權轉載必究,如需轉載請聯(lián)系官方微信號進行授權。
2、轉載時須在文章頭部明確注明出處、保留官方微信、作者和原文超鏈接。如轉自執(zhí)牛耳新媒體(微信號:zhiniuerall)字樣。
3.本網站所轉載的文章資料、圖片、圖表、數(shù)據(jù)僅供參考使用,所刊登的轉載信息均為信息來源方與的個人意見及表達方式,和本網站無任何關系,如有侵權或違法行為應由其相關信息來源方承擔全部責任。
0條評論