how2use 站長

註冊時間: 2003-11-22 文章: 695
|
發表於: 星期五 一月 12, 2007 3:08 pm 文章主題: 設定 robots.txt 教學 |
|
|
robots.txt 樣本:
User-agent: {Spider名}
Disallow: {File位置}
例:設定所有 robot 不能夠收集 /tmp/ 和 /download/ 目錄中的資料。
User-agent: *
Disallow: /tmp/
Disallow: /download/
例:設定所有 robot 不能夠收集 etc.htm 和 /index/work.html 中的資料。
User-agent: *
Disallow: /etc.htm
Disallow: /index/work.html
例:設定所有 robot 不能夠收集所有網頁資料。
User-agent: *
Disallow: /
例:設定 Google 不能夠收集 /tmp/ 目錄中的資料。
User-agent: Googlebot
Disallow: /tmp/
例:設定 Google 和 Excite 不能夠收集 /tmp/ 和 /index/work.html 目錄中的資料。
User-agent: Googlebot
User-agent: ArchitextSpider
Disallow: /tmp/
Disallow: /index/work.html
| 引言回覆: | 搜尋引擎 -Robot 名稱
AltaVista- Scooter
Infoseek -Infoseek
Hotbot -Slurp
AOL Search -Slurp
Excite -ArchitextSpider
Google -Googlebot
Goto -Slurp
Lycos -Lycos
MSN -Slurp
Netscape -Googlebot
NorthernLight -Gulliver
WebCrawler -ArchitextSpider
Iwon -Slurp
Fast -Fast
DirectHit -Grabber
Yahoo Web Pages -Googlebot
Looksmart Web Pages -Slurp
|
|
|