搜索引擎做為網(wǎng)站流量的重要來源,網(wǎng)站的收錄量自然是大部分網(wǎng)站運(yùn)營人員關(guān)心的問題。
先明確一些基本點(diǎn),一個(gè)網(wǎng)頁被收錄與否,有兩個(gè)因素:
是否被爬蟲爬過
頁面質(zhì)量是否過關(guān)
之前提過了收錄率這么一個(gè)指標(biāo),很多網(wǎng)站都懶得去做這個(gè)指標(biāo),“我看看site的數(shù)據(jù)不就行了!”,事實(shí)上沒有這個(gè)指標(biāo),很多工作就無從下手。從數(shù)據(jù)中找出問題,利用數(shù)據(jù)指導(dǎo)解決方案,分析數(shù)據(jù)驗(yàn)證工作成果。 最近看了《深入淺出數(shù)據(jù)分析》這個(gè)本,覺得不錯(cuò),把數(shù)據(jù)分析的方法講得很生動(dòng),建議有興趣的從事數(shù)據(jù)分析的同學(xué)可以買本看看。任何數(shù)據(jù)分析由目標(biāo)->分析->評(píng)估->決策,四個(gè)環(huán)節(jié)組成。
目標(biāo):我們想看一下網(wǎng)站的收錄情況如何,在SEO方面是否還有提高的機(jī)會(huì)。
分析:收錄情況什么算好什么算壞,是不是用一些指標(biāo)來衡量?網(wǎng)站的收錄情況是不是過于籠統(tǒng),是不是應(yīng)該細(xì)分下各個(gè)頁面的收錄情況?
評(píng)估:于是我們需要下面一些數(shù)據(jù)
· 網(wǎng)站的頁面層級(jí)關(guān)系
·各個(gè)層級(jí)頁面帶來的SEO流量
·各個(gè)層級(jí)頁面的收錄情況如何
SEO流量的占比可以從Google Analytics中過濾出來。
頁面數(shù)量可以從數(shù)據(jù)庫獲得,或者通過火車頭or自制小腳本抓取統(tǒng)計(jì)。
收錄率可以將獲取的頁面通過工具進(jìn)行搜索,火車頭也可以。
問題立馬凸顯!
1+2級(jí)目錄頁帶來了大量的流量,收錄率不是很好,優(yōu)化收錄的流量提升突破口在此!
產(chǎn)品頁面數(shù)量很多,收錄也不是很理想,但是帶來的流量有限,除了收錄問題,還有頁面內(nèi)容的問題,本文中先不管它了。
決策:我們的結(jié)論是立刻展開行動(dòng)對(duì)目錄頁面進(jìn)行收錄的優(yōu)化。
看到這邊,似乎剛開始的目標(biāo):“通過優(yōu)化收錄提升流量”
演變成了新的目標(biāo):“如何提高目錄頁面的收錄量”
這邊能不能再次通過數(shù)據(jù)分析的方法進(jìn)行SEO呢?
答案是肯定的!
我們?cè)賮碇匦伦咭槐?目標(biāo)->分析->評(píng)估->決策 的過程
目標(biāo):提高目錄頁面的收錄量
分析:通過本文開始的有關(guān)收錄的兩個(gè)因素,我們需要檢查一下,網(wǎng)頁是否被爬蟲爬行過,網(wǎng)頁的質(zhì)量是不是過關(guān)。
1. 關(guān)于爬蟲的情況,我們需要分析日志,才能確定。于是我們從日志中拆分一系列數(shù)據(jù)看看頁面是否真的被爬行過。
2. 由于頁面質(zhì)量似乎是一個(gè)很難衡量的值,于是我們可以用相同模板下的:
已被爬行的頁面數(shù)量/已被爬行并且被收錄頁面數(shù)量
來評(píng)估該模板頁面質(zhì)量對(duì)收錄的影響大小。如果被爬的頁面都被收錄了,那至少說明這套頁面的內(nèi)容搜索引擎還算認(rèn)可。(實(shí)際情況遠(yuǎn)比這個(gè)復(fù)雜,而且收錄后也有可能因?yàn)橘|(zhì)量問題被刪除,但總比什么參照都沒有要好,對(duì)吧!)
想認(rèn)識(shí)全國各地的創(chuàng)業(yè)者、創(chuàng)業(yè)專家,快來加入“中國創(chuàng)業(yè)圈”
|