中國網(wǎng)民瀏覽習(xí)慣與眾不同
新浪科技:因為是全球化產(chǎn)品,您比較熟悉中國團隊的事情,中國團隊我們會做些什么事情,對Google廣告系統(tǒng)的支持?
郄小虎:我們團隊和Google廣告進行平臺開發(fā)的,我們開發(fā)的是同一個系統(tǒng),不管中國客戶美國客戶,他使用的系統(tǒng)是同一個系統(tǒng),我們是上千、上萬人開發(fā)系統(tǒng),而不是幾十人幾百人,我們站在巨人的肩上,我們享受前面天才工程師搭建的系統(tǒng)。
中國的團隊對中國市場有更深的了解,他們經(jīng)常看到中國用戶的特殊需求。我們會在進行核心系統(tǒng)系統(tǒng)開發(fā)之外,把這些用戶的需求反饋到我們?nèi)驁F隊,我們會把這些功能實現(xiàn)出來。
我可以舉一個例子,在世界上大多數(shù)國家,當(dāng)用戶瀏覽一個頁面的時候,他們的注意力會集中在頁面的某些區(qū)域,這個區(qū)域大概呈現(xiàn)出英文字母的“F”型,主要在頁面最上面和最左邊,這些是頁面關(guān)注度很高的區(qū)域。
我們發(fā)現(xiàn)中國用戶瀏覽習(xí)慣不一樣,他們關(guān)注焦點是均勻分布在頁面所有位置,他們哪兒都看。因為由于頁面設(shè)計的特點,用戶會跳過頁面上面的位置,頁面上面經(jīng)常出現(xiàn)不太相關(guān)的細(xì)節(jié)他們經(jīng)常跳過,到頁面的后半部,發(fā)現(xiàn)這個用戶行為之后,我們對系統(tǒng)做了調(diào)整。我們意識到作為這樣的產(chǎn)品,如果我們只關(guān)注頁面的上部和左部是不夠的對中國的用戶來講,我們對頁面的底部加入大量的信息,對于關(guān)鍵字的建議等等。這是中國團隊為全球廣告團隊作出貢獻的例子,這不僅讓中國廣告系統(tǒng)收益,發(fā)現(xiàn)其他國家用戶也有這樣的瀏覽習(xí)慣。
新浪科技:您說的工程師是全球部署的是嗎?各個不同的地方的改動,都會影響產(chǎn)品的形態(tài)是嗎?
郄小虎:是。我們是在同一個系統(tǒng)上進行開發(fā),可以開發(fā)出針對每個國家地區(qū)的用戶需要的特殊功能,針對這個功能,可以只對這個國家用戶開放。在不適用的國家,會把這個功能關(guān)掉是可以選擇的。
Google廣告核心系統(tǒng):海量存儲、機器學(xué)習(xí)、實時匹配
新浪科技:剛才tiger給我們講了工程師在做Google廣告系統(tǒng)的時候,會面臨的一些問題,我們想了解工程師在技術(shù)上面,會面臨什么樣,除了之前說的資金壓力,他們在技術(shù)上會面臨什么樣的問題呢?
郄小虎:廣告系統(tǒng)是非常大型的分布式系統(tǒng),對完成每一次用戶請求這個過程并不復(fù)雜,我們想象需要一個數(shù)據(jù)庫存儲所有廣告信息,需要一個截面給廣告商使用,他們通過頁面他們購買的關(guān)鍵字,對于每一個關(guān)鍵字的售價和廣告信息等。數(shù)字信息會被傳到全球所有瀏覽器上去,用戶在搜索時,會提供給相應(yīng)匹配的廣告信息展示給用戶,會被回傳下來,用戶月底會收到帳單。
對Google最大的挑戰(zhàn)是,我們?nèi)绾蜗鄳?yīng)海量的廣告商數(shù)據(jù)、用戶數(shù)據(jù),每天超過十億的客戶訪問量。每一次的用戶請求,要進行非常復(fù)雜的競拍過程,這里需要牽涉到上千臺機器的協(xié)同工作。
相比其它部來說,搜索來講,廣告系統(tǒng)對搜索同步性非常高。如果搜索一個網(wǎng)站,網(wǎng)站會進行更新如果我經(jīng)過一段延遲看到廣告最新的內(nèi)容,大家都是可以接受的。對于廣告平臺上的應(yīng)用來講,廣告商他們經(jīng)常會把一個新的廣告上線,或把已有的廣告下線他們會買新的關(guān)鍵字和進行調(diào)整,這些改動需要在新的時間內(nèi)生效。
新浪科技:您能給我們總結(jié)出什么樣的機制,在支撐Google的正常運轉(zhuǎn)嗎?
郄小虎:這個系統(tǒng)簡單分成三大模塊,首先要海量存儲系統(tǒng),這個系統(tǒng)需要存儲所有用戶廣告商的廣告數(shù)據(jù),包括關(guān)鍵字、出價、預(yù)算、廣告創(chuàng)意。同時它要記錄所有的用戶行為,包括每一次廣告展示,每一次廣告的點擊、轉(zhuǎn)換等等。
對于這個數(shù)據(jù)庫來講,它需要處理大量的海量數(shù)據(jù),我們的系統(tǒng)中現(xiàn)在有超過上百萬的廣告客戶,如果你假設(shè)每一個廣告客戶購買一千個關(guān)鍵字?jǐn)?shù)據(jù)量是相當(dāng)大的。
經(jīng)常我們的系統(tǒng)需要完成一些我們的分析工作,比如說我們想知道最多的關(guān)鍵字是哪一個,或者說這段時間內(nèi)用戶搜索的關(guān)鍵字是哪些,這些請求是傳統(tǒng)數(shù)據(jù)庫不能完成的,是由我們工程師開發(fā)的超大容量的數(shù)據(jù)庫進行支持。
第二個模塊是機器學(xué)習(xí)系統(tǒng)。這個系統(tǒng)對我們記錄下來的所有事件分類、分析、處理。比如我們對廣告和一個關(guān)鍵字的相關(guān)性進行處理,我們會對一個頁面上面的概念進行抽取,我們會對用戶的點擊,以及轉(zhuǎn)換機器學(xué)習(xí)。機器學(xué)習(xí)系統(tǒng)會建立非常大數(shù)學(xué)模型,這是支持我們廣告質(zhì)量的分的核心系統(tǒng)。
最后一個是實時匹配系統(tǒng),這個系統(tǒng)完成了我們競拍過程,每一個客戶請求到來之后,我們會從機器系統(tǒng)中找到可以匹配的廣告,從當(dāng)中提取的模型對請求進行預(yù)算,對每個廣告進行評分,最終完成競拍的過程,把排名前面的廣告展示在前面。 本新聞共 5頁,當(dāng)前在第 4頁 1 2 3 4 5
想認(rèn)識全國各地的創(chuàng)業(yè)者、創(chuàng)業(yè)專家,快來加入“中國創(chuàng)業(yè)圈”
|