對于新網站而言,還有什么比網站不被百度收錄或編入索引更令人頭疼?本文旨在幫助您發現可能導致百度無法為您的網站編制索引的可能原因。
如何查看百度的網站索引
如果要首先確定您的網頁(或整個網站)未在百度中編入索引,請按以下步驟操作:
1.使用“site:ww.simcf.cc”進行查詢,這將顯示百度在其搜索引擎中為域編制索引的大概網址,如下圖:
2.登錄百度站長管理平臺,轉到索引量,可查看大概的索引數量,如下圖:
百度不收錄網站的9個常見原因
1.200以外的響應代碼
如果頁面沒有生成200服務器響應代碼,那么不要指望搜索引擎將它們編入索引(或者如果它們曾經已經索引則保持索引)。有時URL會被意外重定向,產生404 0r 500錯誤,具體取決于CMS問題,服務器問題或用戶錯誤。請快速檢查以確保正確加載頁面的網址。
2.Robots.txt阻止
網站的/robots.txt文件(大部分位于網站根目錄下)為百度提供了抓取命令。如果網站上的某個特定網頁缺少不被百度索引,那么robots.txt文件是首先要檢查的地方之一,如果要查看URL是否被robots.txt文件阻止,請跳到百度站長管理平臺進行“抓取診斷”測試,如下:
參考:robots.txt文件協議最佳設置技巧
3.“Noindex”元機器人標簽
網站上的某個網頁可能無法在百度中編入索引的另一個常見原因是,它可能在網頁的
中有一個“noindex”元機器人標記。當百度看到這個元機器人標簽時,它是一個明確的指示,它不應該索引頁面。百度將始終尊重此命令,并且它可以有多種形式,具體取決于其編碼方式:以下是頁面
中的內容截圖:
要檢查網頁是否有“noindex”元機器人標記,請查看源代碼并在
中查找代碼。如果網站使用javascript進行渲染,則可能需要使用Google Chrome的“檢查元素”功能才能正確查看。4.“Noindex”X-Robots標簽
與元機器人標簽類似,X-robots標簽提供了通過頁面級標簽控制百度索引的功能。但是,此標記用于特定頁面或文檔的標題響應中。它通常用于沒有
的非HTML頁面,例如PDF文件,DOC文件以及網站管理員希望遠離百度索引的其他文件。“noindex”X-robots標簽不太可能被意外應用,但您可以使用針對Chrome?的SEO Site Tools擴展程序進行檢查。如下:
5.內容重復
內容重復是任何SEO工作的風險,重復內容可能會使您的網頁遠離百度的索引,如果網頁上重復內容的比例較大可能會使其排名不佳。如果您的網站上有大量類似內容的特定網頁,則可能是因為您的網頁未在百度中編入索引的主要原因(比如采集站的所有就會非常的慢)。
參考:關于網站重復內容的3個思考
6.整體指數缺乏價值
特定頁面或整個網站可能非常糟糕,以至于它無法為百度的索引提供足夠的價值。例如,只有動態生成廣告的聯盟網站對用戶沒有什么價值。百度已經改進了算法,以避免排名(有時避免索引)這樣的網站。
7.網站仍然是新的和未經證實的
新網站不會被百度和其他搜索引擎迅速編入索引,它需要鏈接和其他信號才能讓百度在其搜索結果中對網站進行索引和排名(可見)。這就是鏈接建設對新網站如此重要的原因,對于剛剛上線的網站而言,可以在上線后直接向百度提交鏈接請求,通常會在1小時左右收錄網站主頁。
8.頁面加載時間
如果網頁加載緩慢且未修復,百度可能會隨著時間的推移降低排名,該網頁甚至可能會被搜索引擎移出索引。通常情況下,索引量會下降。
參考:網站打開速度優化指南
9.孤兒頁面
百度會抓取您的網站(和XML站點地圖)以查找指向內容的鏈接,更新其索引并影響網站在搜索結果中的排名(以及其他因素)。如果百度無法在您的網站或外部網站上找到指向內容的鏈接,那么百度就不存在這些鏈接,所以它不會被編入索引,沒有內部鏈接的頁面被稱為“孤立頁面”,它們可能是降低百度索引編制的一個原因。
結論
如果你覺得這些東西太技術化了,最好向SEO專家的咨詢。如果你遇到困難,你需要確定你的時間有多寶貴。嘗試解決百度索引和排名的深夜消費將變得令人厭倦。請記住,索引不等于排名。百度為您的網站編制索引后,網站的內容質量,鏈接建設以及品牌信號將決定網站的排名。但是,索引是SEO旅程的第一步。