詳細(xì)解讀叫你如何查看分析網(wǎng)站日志以及狀態(tài)返回碼
怎樣查看網(wǎng)站日志文件?什么是網(wǎng)站日志?所謂的網(wǎng)站日志,就是網(wǎng)站所在服什么是網(wǎng)站日志?所謂的網(wǎng)站日志,就是網(wǎng)站所在服務(wù)器接受用戶的各種請求的時(shí)候進(jìn)行的處理狀況的記錄,無論是正常處理或者是出了各種錯(cuò)誤,都
怎樣查看網(wǎng)站日志文件?
什么是網(wǎng)站日志?
所謂的網(wǎng)站日志,就是網(wǎng)站所在服什么是網(wǎng)站日志?
所謂的網(wǎng)站日志,就是網(wǎng)站所在服務(wù)器接受用戶的各種請求的時(shí)候進(jìn)行的處理狀況的記錄,無論是正常處理或者是出了各種錯(cuò)誤,都會(huì)在網(wǎng)站日志中記錄下來,其文件結(jié)尾以.log 為擴(kuò)展名。
怎樣查看網(wǎng)站日志?
220.181.108.180 – - [25/May/2011:20:21:56 0800] “GET / HTTP/1.1″ 200 12447 “-” “Mozilla/5.0 (compatible; Baiduspider/2.0; http://www.baidu.com/search/spider.html)”
下面我來詳細(xì)的敘述一下這段網(wǎng)站日志都可以告訴我們哪些有用的信息。
220.181.108.180——這是用戶的IP 地址,相信大家都能輕易看懂。知道了用戶的IP ,你甚至可以通過查詢來得知用戶是來自哪個(gè)國家、哪個(gè)省份、哪個(gè)城市的。查詢得知,這個(gè)IP 來自國內(nèi)北京地區(qū)。不同的網(wǎng)站其用戶群會(huì)有比較明顯的區(qū)別,比如我的博客肯定大多數(shù)訪問者是來自沈陽的,而有的網(wǎng)站其用戶沒有什么明顯的地域區(qū)別。用戶IP 配合下面的關(guān)鍵詞等信息可以讓你更加有效的分析網(wǎng)站的用戶體驗(yàn)做得夠不夠好。
[25/May/2011:20:21:56 0800]——這里講的是發(fā)生該處理請求的具體時(shí)間。這里的時(shí)間是2011年5月25日20點(diǎn)21分56秒,后面的 0800則指的是時(shí)區(qū),即所在地方相對(duì)應(yīng)英國倫敦格林尼治時(shí)間, 0800代表的是東八區(qū)的時(shí)間。
GET ——這是服務(wù)器的處理動(dòng)作,一共只有兩種:GET 和POST 。在網(wǎng)站日志中絕大部分都是GET ,只有在進(jìn)行CGI 處理的時(shí)候才會(huì)出現(xiàn)POST ,否則絕大多數(shù)時(shí)間服務(wù)器的響應(yīng)都是GET ,也就是用戶從服務(wù)器上獲取了頁面或者別的文件。注意了,G ET 后面還有一個(gè)“/”,這里代表的是用戶訪問的頁面,只有一個(gè)斜杠自然代表訪問的是網(wǎng)站首頁。比如GET/http://www.1zhan4.com/ 和GET/兩者表示的含義是一樣的。
HTTP/1.1——這個(gè)代表用戶訪問該頁面的時(shí)候,是通過HTTP1.1協(xié)議進(jìn)行傳輸?shù)模簿褪浅谋緜鬏?.1版本協(xié)議。這個(gè)我們不必理會(huì),因?yàn)榫W(wǎng)站日志中除了你可能用FTP 之外,普通用戶基本都是通過HTTP 協(xié)議來進(jìn)行訪問的(個(gè)別提供FTP 下載的網(wǎng)站除外) 。 200 0 64:
文件被64位系統(tǒng)的訪客或者蜘蛛正常訪問或抓取.
200 0 0:
文件被32位系統(tǒng)的訪客或者蜘蛛正常訪問或抓取.
200 12447——代表的是用戶訪問頁面的時(shí)候返回的狀態(tài)碼。通常狀態(tài)碼有以下幾種:200,301,302,304,404,500等。200代表用戶成功的獲取到了所請求的文件,如果是搜索引擎,則證明蜘蛛在這次爬行中順利的發(fā)現(xiàn)了一些新的內(nèi)容。而301則代表用戶所訪問的某個(gè)頁面url 已經(jīng)做了301重定向(永久性) 處理,302則是暫時(shí)性重定向,如果你的網(wǎng)站日志中有過多的302代碼,那么你需要注意了,是
,不是把301做錯(cuò)了做成了302? 趕緊修改,搜索引擎不喜歡302重定向。404則代表所訪問的頁面已經(jīng)不存在了,或者說訪問的url 根本就是個(gè)錯(cuò)誤的。500則是服務(wù)器的錯(cuò)誤。狀態(tài)碼是比較多的,想要詳細(xì)了解的朋友請自己去搜一下吧,網(wǎng)上相關(guān)的信息還是非常多的。后面的12447代表的是被訪問頁面的體積,我的博客由于采用了gzip 壓縮,所以首頁只有不到12.5KB 。 Mozilla/5.0 (compatible; Baiduspider/2.0; http://www.baidu.com/search/spider.html)——這一行則詳細(xì)的說明了用戶的一些狀況。當(dāng)然,我所選擇的這一段網(wǎng)站日志實(shí)際上是百度蜘蛛作為用戶被網(wǎng)站日志記錄了下來。這一整行就代表了用戶是百度的蜘蛛,注意一下,從今年的5月10號(hào)開始百度蜘蛛的字段發(fā)現(xiàn)了變化,變成了這行代碼。原來的是Baiduspider ( http://www.baidu.com/search/spider.htm)。實(shí)際上從這一部分日志中可以看到用戶采用的是什么瀏覽器,通過哪個(gè)搜索引擎的哪個(gè)關(guān)鍵詞來到了該頁面等等。
以上就是簡單的對(duì)一段網(wǎng)站日志的分析,當(dāng)然實(shí)際上大多數(shù)時(shí)候我們根本不需要這樣人工查看網(wǎng)站日志,有大把的SEO 工具可以供我們使用分析網(wǎng)站日志。不過當(dāng)你的網(wǎng)站確實(shí)出現(xiàn)了一些問題的時(shí)候,那么一般的日志分析軟件就無法幫助你了,你必須親自查看日志,這個(gè)時(shí)候這篇文章說不定就派上用場了,是不?
HTTP 狀態(tài)碼 摘要說明
--------------------------------------------------------------------------------
200 服務(wù)器已成功處理了請求并提供了請求的網(wǎng)頁。
204 服務(wù)器成功處理了請求,但沒有返回任何內(nèi)容。
301 請求的網(wǎng)頁已永久移動(dòng)到新位置。當(dāng)URLs 發(fā)生變化時(shí),使用301代碼。搜索引擎索引中保存新的URL 。
302 請求的網(wǎng)頁臨時(shí)移動(dòng)到新位置。搜索引擎索引中保存原來的URL 。
304 如果網(wǎng)頁自請求者上次請求后沒有更新,則用304代碼告訴搜索引擎機(jī)器人,可節(jié)省帶寬和開銷。
400 服務(wù)器不理解請求的語法。
403 服務(wù)器拒絕請求。
404 服務(wù)器找不到請求的網(wǎng)頁。服務(wù)器上不存在的網(wǎng)頁經(jīng)常會(huì)返回此代碼。
410 請求的資源永久刪除后,服務(wù)器返回此響應(yīng)。該代碼與 404(未找到)代碼相似,但在資源以前存在而現(xiàn)在不存在的情況下,有時(shí)用來替代404 代碼。如果資源已永久刪除,應(yīng)當(dāng)使用 301 指定資源的新位置。
500 服務(wù)器遇到錯(cuò)誤,無法完成請求。
503 服務(wù)器目前無法使用(由于超載或停機(jī)維護(hù))。通常,這只是暫時(shí)狀態(tài)