|
大家好我叫劉凱鵬,花名治平,是阿里媽媽的算法專家和技術(shù)總監(jiān),今天我來和大家聊一聊搜索營銷算法模型的演進。 在阿里,人人都會有一個花名,我的花名很簡單,取自“修身齊家治國平天下”中的治平兩字,借此表達一下對古代詩人家國情懷的憧憬之情。 我與阿里的緣分也一樣的簡單,從哈工大博士畢業(yè)以后就進入了阿里,一路也算順風順水,只不過區(qū)別在于,我畢業(yè)的時候工業(yè)界還是以傳統(tǒng)機器學習方法為主,而到了現(xiàn)在,短短六七年間人工智能已經(jīng)遍地開花,這給業(yè)界造就了巨大的機會,也衍生出了大量的挑戰(zhàn),因此我才來此討論這樣的一個話題。 在入職阿里之前,我在很多國內(nèi)外的互聯(lián)網(wǎng)公司實習過,在經(jīng)過了多個角度的審視感覺,淘寶這一領(lǐng)域?qū)砜隙〞兴l(fā)展,我入職阿里后的 7年里就見證其從一個簡簡單單的購物網(wǎng)站,發(fā)展成今天的巨大規(guī)模。 在阿里工作的技術(shù)人普遍更關(guān)心兩個方面,一是在今天的環(huán)境下,所面臨的數(shù)據(jù)業(yè)務(wù)到底是怎樣的,阿里有著豐富完整閉環(huán)的大數(shù)據(jù)體系,能夠隨時看清行業(yè)會面臨著哪些挑戰(zhàn),這是我工作中最興奮的一點;電商是一個以數(shù)字化為基礎(chǔ)的商業(yè)設(shè)施,技術(shù)是其不斷發(fā)展的核心驅(qū)動力,這給技術(shù)人提供了一個廣闊的舞臺。 舉例來講,我初入阿里時是從事模型類的工作,會接觸到大量的數(shù)據(jù)特征,從特征量級和樣本量級等方面都無法達到世界頂尖,但在師兄的引導(dǎo)下,我所在的團隊不斷思考應(yīng)該如何達成世界頂級的技術(shù),數(shù)據(jù)規(guī)模、訓練平臺、數(shù)據(jù)處理方案不斷的討論,結(jié)果發(fā)現(xiàn)好像事情也沒有想象中的困難,經(jīng)過了幾個月的討論和著手模型制作之后甚至發(fā)現(xiàn)我們的一些技術(shù)甚至已經(jīng)達到世界頂尖。 我覺得這并非因為我們是天才,而是因為我們獲得了這樣一個舞臺,夢想、舞臺和這些條件激發(fā)了我們的潛力,阿里這種世界級的舞臺就為那些聰明皮實樂觀自省、有技術(shù)基礎(chǔ)、技術(shù)熱情和技術(shù)成果的人敞開大門。 我的團隊主要負責阿里的搜索營銷業(yè)務(wù)。傳統(tǒng)購物需要人找貨,當用戶在平臺搜索想買的商品時,搜索引擎會找用戶感興趣的產(chǎn)品進行展現(xiàn),這些商品就獲得了展現(xiàn)流量。商家獲取流量只能通過被動的分配。搜索營銷業(yè)務(wù)就是希望給商家提供一些主動獲取流量的手段,加快其觸達到用戶的速度和發(fā)展速度。提高購物效率,幫助商家完成貨找人的過程。 搜索營銷并非一開始就能達到這一目的的,其發(fā)展分為了三個階段。第一個階段是傳統(tǒng)的基于競價詞營銷階段。商家購買關(guān)鍵詞,系統(tǒng)通過關(guān)鍵詞來完成用戶匹配,通過排序模式運作,在這個時代里最核心的工作是對于關(guān)健詞的理解,把用戶的意圖去改寫成相關(guān)的關(guān)鍵詞進行匹配,進行點擊率的預(yù)估,然后去把最終的排序做到面向平臺收益最大化。這種模式的問題很明顯,在相對較小的樣本規(guī)模和特征下才能完成。 第二階段是伴隨著移動時代所造成的個性化服務(wù)時代。這個時代面臨的兩大難題一在于如何讓匹配和排序有個性化表現(xiàn);二則是如何幫助商家更好的定位消費者。這就需要深入的理解用戶意圖,個性化的分配流量;同時,還要幫助商家解決好流量的控制問題,幫助他們更好的表達營銷意圖。在受眾選擇、出價、預(yù)算、創(chuàng)意制作等各方面適應(yīng)個性化變化?。 第三個階段以人工智能技術(shù)為代表的智能營銷時代。這個時代深度學習驅(qū)動新工具和技術(shù)理解非結(jié)構(gòu)化數(shù)據(jù),以用戶整個的行為序列完成基于記憶的深度學習,推動購物體驗的完善;在商家層面,對用戶意圖更好的理解,對長中短用戶興趣的刻畫都會更精準,營銷更高效。 但這個時代依然有很多挑戰(zhàn),比如如何利用深度學習的技術(shù)對用戶認知過程進行更好的建模和學習、如何更精準的了解商家訴求、如何進行宏觀調(diào)控、如何優(yōu)化市場機制等問題依然存在,在這種情況下,技術(shù)與業(yè)務(wù)將會結(jié)合的更為緊密。 我們現(xiàn)在面臨的很多業(yè)務(wù)問題都需要最頂尖的技術(shù)手段來解決,所以同工業(yè)界和學術(shù)界保持良好的互動關(guān)系就很有必要。希望能形成一個學習、應(yīng)用到創(chuàng)新循環(huán)。 第一,從業(yè)務(wù)問題出發(fā),去研究界找到最佳匹配研究領(lǐng)域,把研究成果應(yīng)用到業(yè)務(wù)問題里,這就是一個借鑒過程。第二就是應(yīng)用的過程,把它具體應(yīng)用到我們業(yè)務(wù)里,然后產(chǎn)生自己的想法,能夠去讓整個業(yè)務(wù)發(fā)展的更好;第三,從本身的業(yè)務(wù)問題出發(fā),找到所借鑒技術(shù)可提升的點,基于豐富的數(shù)據(jù)和技術(shù)平臺得到更加具有創(chuàng)造性成果,進而反饋到學術(shù)界,這樣就形成了一個循環(huán)。在這種方式下,對團隊個人的技術(shù)能力成長會有很強的驅(qū)動力,對團隊的業(yè)務(wù)目標貢獻也會形成正向循環(huán)。 那么應(yīng)當如何理解阿里媽媽的技術(shù)水平在世界上的地位呢?我認為技術(shù)應(yīng)該是能夠完整、系統(tǒng)化解決業(yè)務(wù)問題的。阿里媽媽的技術(shù)是依托于阿里的閉環(huán)數(shù)據(jù)和業(yè)務(wù)挑戰(zhàn)而產(chǎn)生的,這是世界上獨一無二的業(yè)務(wù)場景,因而我們構(gòu)建了一個完整的技術(shù)棧,從最底層的數(shù)據(jù)處理到中間的實時系統(tǒng)、訓練平臺、模型應(yīng)用再到一系列的平臺分析等,從而形成一個完整的技術(shù)圖譜。在搜索營銷的場景中,建立了高水準的技術(shù)體系,回饋到業(yè)務(wù)訴求中。 如果來看未來技術(shù)的發(fā)展趨勢,我覺得可以從搜索的趨勢來入手就會明晰。最初的 PC時代,搜索承載著互聯(lián)網(wǎng)的絕大部分流量,而移動時代到來后,場景碎片化、數(shù)據(jù)個性化使得獲取信息的方式趨向于推薦等被動獲取。但隨著技術(shù)的發(fā)展,被動獲取信息并不是最高效的一種手段,因此在未來隨著人工智能的發(fā)展,甚至是語音交互、人機交互等方式的普及,主動獲取信息將又成為主流。屆時,搜索可能會再次成為主流,這時可以結(jié)合物聯(lián)網(wǎng)等新的技術(shù)讓用戶更主動更好的獲取所需信息, 搜索營銷也會有相應(yīng)的變化。 技術(shù)的發(fā)展越來越快,想走在時代的前沿就需要不斷的學習。我個人學習的方式比較簡單,一種是知識驅(qū)動,一種是問題驅(qū)動。所謂知識驅(qū)動就是在當前最流行的領(lǐng)域,緊跟時代的發(fā)展學習各類知識、算法和編程語言等。但我個人更看好的是問題驅(qū)動,這需要去看當前面臨的核心問題是什么,解決這個問題需要怎樣的知識網(wǎng)絡(luò)。從問題出發(fā)不僅可以幫助建立健全的知識體系,彌補不足,還可以進而激發(fā)自身潛力結(jié)合到實踐當中。 對于技術(shù)人來講,我希望大家能夠做到聽的清楚,想的深刻,說的明白,干的認真。也就是說能夠在任何場景下聽清楚別人說的話,然后進行思考,想通問題所在,接下來去訓練自己,去讓別人也能夠聽清楚,過程中可以通過別人的反饋完成對自己能力的提升,最后投入到實干之中,以認真的態(tài)度完成業(yè)務(wù),不斷進步。 以我目前的團隊來看,目前分為了算法策略團隊和工程架構(gòu)團隊。算法策略團隊主要負責深度學習、強化學習、自然語言處理、圖形處理等技術(shù)領(lǐng)域,然后將這些技術(shù)應(yīng)用到業(yè)務(wù)場景中,一方面幫助用戶找到合適的商品,另一方面幫助商家提升營銷效果和效率。而工程架構(gòu)團隊則主要負責解決高并發(fā)條件下如何提升系統(tǒng)服務(wù)性能,保障系統(tǒng)服務(wù)的穩(wěn)定性。這就包含了機器學習的內(nèi)容,如從簡單的線性模型的機器學習升級到深度模型的機器學習,增強計算力應(yīng)對更大挑戰(zhàn)。 在團隊的人才培養(yǎng)方面,首先會建立團隊的愿景和使命,需要讓所有人都明確我們的愿景使命是什么,然后再制訂出團隊的文化。我們鼓勵個人自我超越,讓個人找到自我超越的方向,然后給予動力,幫他們找到自己成長的主要舞臺。另一方面整個團隊希望能夠共同成長。團隊中有各種各樣的分享機制,內(nèi)部分享的內(nèi)容可以接受團隊成員的意見,建立團隊內(nèi)部的共同學習共同成長的機制,形成這樣的循環(huán)。在團隊的共同愿景下,達到共同成長這樣一個循環(huán),讓團隊成員能夠找到成長的路徑。而且,目前團隊的成員基本上都是來自國內(nèi)外頂尖的學校和公司,有超過百分之三四十的同學都是博士畢業(yè)的,這種情形可以幫助團隊快速的成長。 在公司層面來看,阿里對人才有一個通用的描述:聰明、皮實、樂觀、自省。而我們團隊對人才的觀念是,第一要有創(chuàng)新力。目前團隊面臨巨大的數(shù)據(jù)挑戰(zhàn),日新月異的業(yè)務(wù)變化場景下,團隊希望所有人有對技術(shù)和業(yè)務(wù)高度的敏感性,這種情況下創(chuàng)新力尤為重要;第二能夠有信念力。相信技術(shù)的力量,相信技術(shù)能夠改變世界,也相信世界能夠因為我們這樣的人而變得不同。 近日,我們阿里媽媽聯(lián)合國際人工智能聯(lián)合會議(IJCAI-2018)以及阿里云天池平臺舉辦了國際廣告算法大賽。賽題是搜索營銷場景下的轉(zhuǎn)化率預(yù)估。轉(zhuǎn)化率是衡量商家營銷效果的一個重要指標。對轉(zhuǎn)化率的準確預(yù)估是我們提高平臺營銷效率的重要一環(huán)。在這次大賽中,我們會提供平臺積累的海量真實交易數(shù)據(jù),希望和學界、業(yè)界一起來探索這里面的技術(shù)問題。 我發(fā)起這次大賽的初衷有三個。第一,我希望通過這樣的一個算法大賽去讓更多的業(yè)界和學界能夠了解我們的業(yè)務(wù)形態(tài)和我們在這里面真正關(guān)心的一些核心的技術(shù)問題。第二。從工業(yè)界和學界關(guān)系來講,學界沒有數(shù)據(jù),他們很少能拿到數(shù)據(jù),我們把這些數(shù)據(jù)脫敏,讓大家可以利用這些數(shù)據(jù)來進行研究。從中看到挑戰(zhàn)在哪,技術(shù)的關(guān)注點在哪,這里面重點難點是什么樣的,這樣能夠吸引大家對技術(shù)關(guān)注。同時也希望通過這個去對外輸出阿里媽媽的一些技術(shù)成果,擴大和大家的交流合作,把技術(shù)做的更好。第三,我們希望能夠鼓勵創(chuàng)新,也能發(fā)現(xiàn)人才,這次的賽題與我們工作中的很多題目類似,我們希望能夠發(fā)現(xiàn)一些隊伍和選手有更多新的想法,也希望能夠找到優(yōu)秀的人才。 |
|
|