搜索引擎數(shù)據(jù)庫中的所有網(wǎng)頁,都是由Robot程序自動抓取收錄的。但我們網(wǎng)站上總會有部分私密性數(shù)據(jù)不希望被搜索引擎抓取,這時候,就需要robots.txt。
robots.txt 是一個標準文檔,意在阻止搜索引擎的Spider(蜘蛛)從您的 Web 服務器下載某些或全部信息,控制Spider的搜索范圍。robots.txt的設置很簡單,只要用記事本或其他文本編輯器,依照自己的網(wǎng)站需求,設定一系列選項,然后將其上傳到網(wǎng)站根目錄即可。robots.txt的設置如下:
User-agent: 搜索引擎的spider代號
Disallow: 輸入數(shù)據(jù)夾或文件名的路徑
如設定所有的spider都能夠搜索及抓取整個網(wǎng)站。
User-agent: *
Disallow:
如拒絕Google搜索及抓取整個網(wǎng)站,但允許其它的
User-agent: Googlebot
Disallow:
如拒絕所有的Spider
User-agent: *
Disallow: /
如拒絕所有的Spider搜索及抓取protect目錄及seo目錄下abc.html文件
User-agent: *
Disallow: /protect/
Disallow: /seo/abc.html
如拒絕google搜索及抓取protect目錄及seo目錄下abc.html文件,但允許其他的
User-agent: Googlebot
Disallow: /protect/
Disallow: /seo/abc.html
很簡單吧?另有一點請記住,搜索引擎不會立即對robots.txt 文件所作的更改作出反應,必須等到搜索引擎下一次讀取該文件。這段時間,依搜索引擎及具體網(wǎng)站情況,從幾小時到幾天不等。
?石家莊網(wǎng)站建設的優(yōu)點:我們是專屬定制,制作符合您公司業(yè)務、風格的網(wǎng)站,這就做到給您制作的網(wǎng)站是網(wǎng)絡上獨一無二的網(wǎng)站,這樣更有利于搜索引擎的收錄。如果您喜歡網(wǎng)絡上某個風格的網(wǎng)站或者網(wǎng)站模板,我們是只仿制而不直接套用,我們會對其中的結構和樣式做增減優(yōu)化,做…
?競價排名營銷是一種通過 競價購買搜索引擎中關鍵詞或關鍵短語的廣告方式。競價排名營銷分為兩種類型。 第一種,直接為真正的搜索引擎結果的排名付費,也就是說付的錢越多,網(wǎng)頁所獲得的排名名也就越高。 第二種則更類似于普通的廣告。這種競價排名營銷方式通過…
?網(wǎng)站優(yōu)化對網(wǎng)站來說是非常重要的,直接決定和影響著網(wǎng)站所起到的作用,以及在各個地方當中的排名。在進行seo優(yōu)化的過程中,我們必須要堅持一定的原則,真正的把這些事情做得更好,才可以確保最終的結果,這對于我們來說是非常重要的事。 SEO優(yōu)化主要分為8小步: …