Baiduspider是什么蜘蛛？_Baiduspider_是什么爬虫？_怎么屏蔽Baiduspider

百度相關的各個蜘蛛Bot

圖片搜尋：Baiduspider-image

影片搜尋：Baiduspider-video

新聞搜尋：Baiduspider-news

百度搜藏：Baiduspider-favo

百度聯盟：Baiduspider-cpro

商務搜尋：Baiduspider-ads

網頁以及其他搜尋：Baiduspider

百度蜘蛛，是百度搜尋引擎的一個自動程式。它的作用是訪問收集整理網際網路上的網頁、圖片、影片等內容，然後分門別類建立索引資料庫，使使用者能在百度搜尋引擎中搜尋到您網站的網頁、圖片、影片等內容。

Baiduspider對一個網站伺服器造成的訪問壓力如何？

答：Baiduspider會自動根據伺服器的負載能力調節訪問密度。在連續訪問一段時間後，Baiduspider會暫停一會，以防止增大伺服器的訪問壓力。所以在一般情況下，Baiduspider對您網站的伺服器不會造成過大的壓力。

為什麼Baiduspider不停的抓取我的網站？

答：或許您的網站權重高或者對於您網站上新產生的或者持續、有規律更新的頁面，Baiduspider會持續抓取。此外，您也可以檢查網站訪問日誌中Baiduspider的訪問是否正常，以防止有人惡意冒充Baiduspider來頻繁抓取您的網站。如果您發現Baiduspider非正常抓取您的網站，請反饋至，並請儘量給出Baiduspider對貴站的訪問日誌，以便於我們跟蹤處理。

我不想我的網站被Baiduspider訪問，我該怎麼做？

答：Baiduspider遵守網際網路robots協議。您可以利用robots.txt檔案完全禁止Baiduspider訪問您的網站，或者禁止Baiduspider訪問您網站上的部分檔案。注意：禁止Baiduspider訪問您的網站，將使您的網站上的網頁，在百度搜尋引擎以及所有百度提供搜尋引擎服務的搜尋引擎中無法被搜尋到。

為什麼我的網站已經加了robots.txt，還能在百度搜尋出來？

答：因為搜尋引擎索引資料庫的更新需要時間。雖然Baiduspider已經停止訪問您網站上的網頁，但百度搜尋引擎資料庫中已經建立的網頁索引資訊，可能需要二至四周才會清除。另外也請檢查您的robots配置是否正確。

我希望我的網站內容被百度索引但不被儲存快照，我該怎麼做？

答：Baiduspider遵守網際網路metarobots協議。您可以利用網頁meta的設定，使百度顯示只對該網頁建索引，但並不在搜尋結果中顯示該網頁的快照。

和robots的更新一樣，因為搜尋引擎索引資料庫的更新需要時間，所以雖然您已經在網頁中透過meta禁止了百度在搜尋結果中顯示該網頁的快照，但百度搜尋引擎資料庫中如果已經建立了網頁索引資訊，可能需要二至四周才會線上上生效。

百度蜘蛛在robots.txt中的名字是什麼？

答：“Baiduspider” 首字母B大寫，其餘為小寫。

Baiduspider多長時間之後會重新抓取我的網頁？

答：百度搜尋引擎每週更新，網頁視重要性有不同的更新率，頻率在幾天至一月之間，Baiduspider會重新訪問和更新一個網頁。

Baiduspider抓取造成的頻寬堵塞？

答：Baiduspider的正常抓取並不會造成您網站的頻寬堵塞，造成此現象可能是由於有人冒充baidu的spider惡意抓取。如果您發現有名為Baiduspider的agent抓取並且造成頻寬堵塞，請儘快和我們聯絡。您可以將資訊反饋至百度網頁投訴中心，如果能夠提供您網站該時段的訪問日誌將更加有利於我們的分析。

不想讓百度抓取，可以選擇robots.txt協議禁止。

User-agent: Baiduspider

Disallow: /

如果還是禁止不了，可以選擇nginx規則禁止訪問，如下：

if ($http_user_agent ~* "Baiduspider") {

return 403;

}

Baiduspider