一、網(wǎng)站內容重復的情況: 1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰 2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采
一、網(wǎng)站內容重復的情況: 1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰 2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點的。 3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側總是固定放一些版塊或欄目,這些欄目的內容從來不進行更新,或者各個頁面的右側都是前篇一律的內容,就會造成頁面重復度高。 4、未設置404錯誤頁面,當我們刪除某一個頁面的時候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。 5、動態(tài)頁面和靜態(tài)并存,百度爬去目錄時收錄了大量動態(tài)頁面 6、網(wǎng)站內容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復收錄。 重復內容是指不同的URL鏈接內容卻是相同的,同時收錄多個重復頁面,設置多個頁面進行介紹,但是網(wǎng)頁的大體內容是相同的,這樣處理的方法是錯誤的。 二、重復內容的檢測方法 1、對于檢測一篇文章是否重復內容,title:+文章標題可找出相同的文章。 2、從文中摘取一段話,在百度搜一下,出現(xiàn)大量紅字,表明這篇文章的重復度高 3、站內搜索,可以找到出現(xiàn)多次的內容。 4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。 三、如何消除重復內容 1、原創(chuàng)內容的增加 對于網(wǎng)站內容多為采集或簡單偽原創(chuàng)的網(wǎng)站,企贏001建議增加原創(chuàng)文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。 2、網(wǎng)站固定欄目內容隨機展示 可以根據(jù)正文的關鍵詞,隨機調用右側欄目的文章內容,讓每一個頁面都有不一樣的內容,避免大量頁面相似度高的情況出現(xiàn)。 3、設置404頁面 告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。 4、頁面設置獨立的Meta標簽 關鍵詞、標簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據(jù)一定的規(guī)則設置。