<?xml version="1.0" encoding="windows-1251"?>
<rss version="2.0">
<channel>
<title>Robots.Txt по-русски - RobotsExclusion/guide</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide</link>
<description>History/revisions of Robots.Txt по-русски/RobotsExclusion/guide</description>
<language>en-us</language>
<item>
<title>2006-11-03 09:03:26</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-11-03+09%3A03%3A26</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a name=".robotsexclusion.guide" href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-11-03+09%3A03%3A26">2006-11-03 09:03:26&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide">2007-07-01 22:18:30&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">Затметьте, что&amp;nbsp;каждая директория указана на&amp;nbsp;отдельной строке &amp;ndash; нельзя написать &amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Нельзя также разбивать одну инструкцию Disallow или&amp;nbsp;User-agent на&amp;nbsp;несколько строк, т.к. перенос строки используется для&amp;nbsp;отделения инструкций друг от&amp;nbsp;друга.&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">Затметьте, что&amp;nbsp;каждая директория указана на&amp;nbsp;отдельной строке &amp;ndash; нельзя написать &amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Нельзя также разбивать одну инструкцию Disallow bkb&amp;nbsp;User-agent на&amp;nbsp;несколько строк, т.к. перенос строки используется для&amp;nbsp;отделения инструкций друг от&amp;nbsp;друга.&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-18 18:44:57</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-18+18%3A44%3A57</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-18+18%3A44%3A57">2006-08-18 18:44:57&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-11-03+09%3A03%3A26">2006-11-03 09:03:26&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">Зто&amp;nbsp;не&amp;nbsp;спецификация &amp;ndash; подробное описание и&amp;nbsp;синтаксис можно посмотреть в&amp;nbsp;&lt;a name=".robotsexclusion.spec" href="http://robotstxt.org.ru/RobotsExclusion/spec" class="" title="Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;spec">стандарте исключений для&amp;nbsp;роботов&lt;/a>.&lt;br />
Стандарт исключений для&amp;nbsp;роботов по&amp;nbsp;сути своей очень прост. Вкратце, это&amp;nbsp;работает следующим образом:&lt;br />
На&amp;nbsp;сайте может быть только один файл &amp;laquo;/robots.txt&amp;raquo;. Например, не&amp;nbsp;следует помещать файл robots.txt в&amp;nbsp;пользовательские поддиректории &amp;ndash; все&amp;nbsp;равно роботы не&amp;nbsp;будут их&amp;nbsp;там искать. Если вы&amp;nbsp;хотите иметь возможность создавать файлы robots.txt в&amp;nbsp;поддиректориях, то&amp;nbsp;вам нужен способ программно собирать их&amp;nbsp;в один файл robots.txt, расположенный в&amp;nbsp;корне сайта. Вместо этого можно использовать &lt;a name=".robotsexclusion.meta" href="http://robotstxt.org.ru/RobotsExclusion/meta" class="" title="Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;meta">Мета-тег Robots&lt;/a>.&lt;br />
Затметьте, что&amp;nbsp;каждая директория указана на&amp;nbsp;отдельной строке &amp;ndash; нельзя написать &amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Нельзя также разбивать одну инструкцию Disallow bkb&amp;nbsp;User-agent на&amp;nbsp;несколько строк, т.к. перенос строки используется для&amp;nbsp;отделения инструкций друг от&amp;nbsp;друга.&lt;br />
Это&amp;nbsp;довольно непросто, т.к. не&amp;nbsp;существует инструкции &amp;#147;Allow&amp;#148;. Вместо этого можно переместить все&amp;nbsp;файлы кроме того, который вы&amp;nbsp;хотите разрешить к&amp;nbsp;индексации в&amp;nbsp;поддиректорию и&amp;nbsp;запретить ее&amp;nbsp;индексацию:&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">Зто&amp;nbsp;не&amp;nbsp;спецификация &amp;ndash; подробное описание и&amp;nbsp;синтаксис можно посмотреть в&amp;nbsp;&lt;a  href="http://robotstxt.org.ru/RobotsExclusion/spec" class="" title="Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;spec">Стандарте исключений для&amp;nbsp;роботов&lt;/a>.&lt;br />
Стандарт ислючений для&amp;nbsp;роботов по&amp;nbsp;сути своей очень прост. В&amp;nbsp;кратце, это&amp;nbsp;работает следующим образом:&lt;br />
На&amp;nbsp;сайте может быть только один файл &amp;laquo;/robots.txt&amp;raquo;. Например, не&amp;nbsp;следует помещать файл robots.txt в&amp;nbsp;пользовательские поддеректории &amp;ndash; все&amp;nbsp;равно роботы не&amp;nbsp;будут их&amp;nbsp;там искать. Если вы&amp;nbsp;хотите иметь возможность создавать файлы robots.txt в&amp;nbsp;поддеректориях, то&amp;nbsp;вам нужен способ программно собирать их&amp;nbsp;в один файл robots.txt, расположеный в&amp;nbsp;корне сайта. Вместо этого можно использовать &lt;a name=".robotsexclusion" href="http://robotstxt.org.ru/RobotsExclusion#meta" class="" title="Robots&amp;nbsp;Exclusion">Мета-тег Robots&lt;/a>.&lt;br />
Затметьте, что&amp;nbsp;каждая директория указани на&amp;nbsp;отдельной строке &amp;ndash; нельзя написать &amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Нельзя также разбивать одну инструкцию Disallow bkb&amp;nbsp;User-agent на&amp;nbsp;несколько строк, т.к. перенос строки используется для&amp;nbsp;отделения инструкций друг от&amp;nbsp;друга.&lt;br />
Это&amp;nbsp;довольно непросто, т.к. не&amp;nbsp;существет инструкции &amp;#147;Allow&amp;#148;. Вместо этого можно переместить все&amp;nbsp;файлы кроме того, который вы&amp;nbsp;хотите разрешить к&amp;nbsp;индексации в&amp;nbsp;поддиректорию и&amp;nbsp;запретить ее&amp;nbsp;индексацию:&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-18 09:22:44</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-18+09%3A22%3A44</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-18+09%3A22%3A44">2006-08-18 09:22:44&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-18+18%3A44%3A57">2006-08-18 18:44:57&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">&lt;a name="h86-1">&lt;/a>&lt;h3>Запретить весь сайт для&amp;nbsp;индексации всеми роботами&lt;/h3>&lt;a name="h86-2">&lt;/a>&lt;h3>Разрешить всем роботам индексировать весь сайт&lt;/h3>
Или&amp;nbsp;можете просто создать пустой файл &amp;laquo;/robots.txt&amp;raquo;.&lt;a name="h86-3">&lt;/a>&lt;h3>Закрыть от&amp;nbsp;индексации только несколько каталогов&lt;/h3>&lt;a name="h86-4">&lt;/a>&lt;h3>Запретить индексацию сайта только для&amp;nbsp;одного робота&lt;/h3>&lt;a name="h86-5">&lt;/a>&lt;h3>Разрешить индексацию сайта одному роботу и&amp;nbsp;запретить всем остальным&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;Yandex&lt;br />====Запретить&amp;nbsp;к&amp;nbsp;индексации&amp;nbsp;все&amp;nbsp;файлы&amp;nbsp;кроме&amp;nbsp;одного====&lt;br />Это&amp;nbsp;довольно&amp;nbsp;непросто,&amp;nbsp;т.к.&amp;nbsp;не&amp;nbsp;существет&amp;nbsp;инструкции&amp;nbsp;"Allow".&amp;nbsp;Вместо&amp;nbsp;этого&amp;nbsp;можно&amp;nbsp;переместить&amp;nbsp;все&amp;nbsp;файлы&amp;nbsp;кроме&amp;nbsp;того,&amp;nbsp;который&amp;nbsp;вы&amp;nbsp;хотите&amp;nbsp;разрешить&amp;nbsp;к&amp;nbsp;индексации&amp;nbsp;в&amp;nbsp;поддиректорию&amp;nbsp;и&amp;nbsp;запретить&amp;nbsp;ее&amp;nbsp;индексацию:&lt;br />Disallow:&amp;nbsp;/docs/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;br />
Либо вы&amp;nbsp;можете запретить все&amp;nbsp;запрещенные к&amp;nbsp;индексации файлы:&lt;br />
Disallow: /private.html&lt;br />
Disallow: /foo.html&lt;br />
Disallow: /bar.html%%&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">The&amp;nbsp;Robot will simply look for&amp;nbsp;a&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; URL&amp;nbsp;on&amp;nbsp;your site, where a&amp;nbsp;site is&amp;nbsp;defined as&amp;nbsp;a HTTP server running on&amp;nbsp;a particular host and&amp;nbsp;port number. For&amp;nbsp;example:&lt;a name="h86-1">&lt;/a>&lt;h3>To exclude all&amp;nbsp;robots from the&amp;nbsp;entire server&lt;/h3>&lt;a name="h86-2">&lt;/a>&lt;h3>To allow all&amp;nbsp;robots complete access&lt;/h3>
Or&amp;nbsp;create an&amp;nbsp;empty &amp;laquo;/robots.txt&amp;raquo; file.&lt;a name="h86-3">&lt;/a>&lt;h3>To exclude all&amp;nbsp;robots from part of&amp;nbsp;the server&lt;/h3>&lt;a name="h86-4">&lt;/a>&lt;h3>To exclude a&amp;nbsp;single robot&lt;/h3>&lt;a name="h86-5">&lt;/a>&lt;h3>To allow a&amp;nbsp;single robot&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;WebCrawler&lt;br />====To&amp;nbsp;exclude&amp;nbsp;all&amp;nbsp;files&amp;nbsp;except&amp;nbsp;one====&lt;br />This&amp;nbsp;is&amp;nbsp;currently&amp;nbsp;a&amp;nbsp;bit&amp;nbsp;awkward,&amp;nbsp;as&amp;nbsp;there&amp;nbsp;is&amp;nbsp;no&amp;nbsp;"Allow"&amp;nbsp;field.&amp;nbsp;The&amp;nbsp;easy&amp;nbsp;way&amp;nbsp;is&amp;nbsp;to&amp;nbsp;put&amp;nbsp;all&amp;nbsp;files&amp;nbsp;to&amp;nbsp;be&amp;nbsp;disallowed&amp;nbsp;into&amp;nbsp;a&amp;nbsp;separate&amp;nbsp;directory,&amp;nbsp;say&amp;nbsp;"docs",&amp;nbsp;and&amp;nbsp;leave&amp;nbsp;the&amp;nbsp;one&amp;nbsp;file&amp;nbsp;in&amp;nbsp;the&amp;nbsp;level&amp;nbsp;above&amp;nbsp;this&amp;nbsp;directory:&lt;br />Disallow:&amp;nbsp;/~joe/docs/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;br />
Alternatively you&amp;nbsp;can explicitly disallow all&amp;nbsp;disallowed pages:&lt;br />
Disallow: /joe/private.html&lt;br />
Disallow: /joe/foo.html&lt;br />
Disallow: /joe/bar.html%%&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 09:03:22</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+09%3A03%3A22</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+09%3A03%3A22">2006-08-17 09:03:22&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-18+09%3A22%3A44">2006-08-18 09:22:44&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">Как&amp;nbsp;видите, файл robots.txt нужно класть исключительно в&amp;nbsp;корень сайта.&lt;a name="h86-1">&lt;/a>&lt;h3>Что писать в&amp;nbsp;файл robots.txt&lt;/h3>
В&amp;nbsp;файл robots.txt обычно пишут нечто вроде:&lt;br />
В&amp;nbsp;этом примере запрещена индексация трех директорий.&lt;br />
Затметьте, что&amp;nbsp;каждая директория указани на&amp;nbsp;отдельной строке &amp;ndash; нельзя написать &amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Нельзя также разбивать одну инструкцию Disallow bkb&amp;nbsp;User-agent на&amp;nbsp;несколько строк, т.к. перенос строки используется для&amp;nbsp;отделения инструкций друг от&amp;nbsp;друга.&lt;br />
Регулярные выражения и&amp;nbsp;символы подстановки так&amp;nbsp;же&amp;nbsp;нельзя использовать. &amp;laquo;Звездочка&amp;raquo; (*) в&amp;nbsp;инструкции User-agent означает &amp;laquo;любой робот&amp;raquo;. Инструкции вида &amp;laquo;Disallow: *.gif&amp;raquo; или&amp;nbsp;&amp;laquo;User-agent: Ya*" не&amp;nbsp;поддерживаются.&lt;br />
Конкретные инструкции в&amp;nbsp;robots.txt зависят от&amp;nbsp;вашего сайта и&amp;nbsp;того, что&amp;nbsp;вы&amp;nbsp;захотите закрыть от&amp;nbsp;индексации. Вот&amp;nbsp;несколько примеров:&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">So, you&amp;nbsp;need to&amp;nbsp;provide the&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; in&amp;nbsp;the top-level of&amp;nbsp;your URL&amp;nbsp;space. How&amp;nbsp;to&amp;nbsp;do this depends on&amp;nbsp;your particular server software and&amp;nbsp;configuration.&lt;br />
For&amp;nbsp;most servers it&amp;nbsp;means creating a&amp;nbsp;file in&amp;nbsp;your top-level server directory. On&amp;nbsp;a UNIX machine this might be&amp;nbsp;/usr/local/etc/httpd/htdocs/robots.txt&lt;a name="h86-1">&lt;/a>&lt;h3>What to&amp;nbsp;put into the&amp;nbsp;robots.txt file&lt;/h3>
The&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; file usually contains a&amp;nbsp;record looking like this:&lt;br />
In&amp;nbsp;this example, three directories are&amp;nbsp;excluded.&lt;br />
Note that you&amp;nbsp;need a&amp;nbsp;separate &amp;#147;Disallow&amp;#148; line for&amp;nbsp;every URL&amp;nbsp;prefix you&amp;nbsp;want to&amp;nbsp;exclude &amp;mdash; you&amp;nbsp;cannot say&amp;nbsp;&amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Also, you&amp;nbsp;may not&amp;nbsp;have blank lines in&amp;nbsp;a record, as&amp;nbsp;they are&amp;nbsp;used to&amp;nbsp;delimit multiple records.&lt;br />
Note also that regular expression are&amp;nbsp;&lt;strong>&lt;/strong>not&lt;strong>&lt;/strong> supported in&amp;nbsp;either the&amp;nbsp;User-agent or&amp;nbsp;Disallow lines. The&amp;nbsp;'*' in&amp;nbsp;the User-agent field is&amp;nbsp;a special value meaning &amp;#147;any robot&amp;#148;. Specifically, you&amp;nbsp;cannot have lines like &amp;laquo;Disallow: /tmp/*" or&amp;nbsp;&amp;laquo;Disallow: *.gif&amp;#148;.&lt;br />
What you&amp;nbsp;want to&amp;nbsp;exclude depends on&amp;nbsp;your server. Everything not&amp;nbsp;explicitly disallowed is&amp;nbsp;considered fair game to&amp;nbsp;retrieve. Here follow some examples:&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 08:54:34</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+08%3A54%3A34</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A54%3A34">2006-08-17 08:54:34&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+09%3A03%3A22">2006-08-17 09:03:22&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">&lt;a name="h86-1">&lt;/a>&lt;h3>Введение&lt;/h3>
||URL Сайта |URL файла robots.txt ||&lt;br />
На&amp;nbsp;сайте может быть только один файл &amp;laquo;/robots.txt&amp;raquo;. Например, не&amp;nbsp;следует помещать файл robots.txt в&amp;nbsp;пользовательские поддеректории &amp;ndash; все&amp;nbsp;равно роботы не&amp;nbsp;будут их&amp;nbsp;там искать. Если вы&amp;nbsp;хотите иметь возможность создавать файлы robots.txt в&amp;nbsp;поддеректориях, то&amp;nbsp;вам нужен способ программно собирать их&amp;nbsp;в один файл robots.txt, расположеный в&amp;nbsp;корне сайта. Вместо этого можно использовать &lt;a  href="http://robotstxt.org.ru/RobotsExclusion#meta" class="" title="Robots&amp;nbsp;Exclusion">Мета-тег Robots&lt;/a>.&lt;br />
Не&amp;nbsp;забывайте, что&amp;nbsp;URL-ы чувствительны к&amp;nbsp;регистру, и&amp;nbsp;название файла &amp;laquo;/robots.txt&amp;raquo; должно быть написано полностью в&amp;nbsp;нижнем регистре.&lt;br />
||Неправильное расположение robots.txt||&lt;br />
||http://www.w3.org/admin/robots.txt|Файл находится не&amp;nbsp;в корне сайта||&lt;br />
||http://www.w3.org/~timbl/robots.txt|Файл находится не&amp;nbsp;в корне сайта||&lt;br />
||ftp://ftp.w3.com/robots.txt|Роботы не&amp;nbsp;индексируют ftp||&lt;br />
||http://www.w3.org/Robots.txt|Название файла не&amp;nbsp;в нижнем регистре||&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">&lt;a name="h86-1">&lt;/a>&lt;h3>Introduction&lt;/h3>
||URL Сайта |Соответствующий URL&amp;nbsp;файла robots.txt ||&lt;br />
Note that there can&amp;nbsp;only be&amp;nbsp;a single &amp;laquo;/robots.txt&amp;raquo; on&amp;nbsp;a site. Specifically, you&amp;nbsp;should not&amp;nbsp;put &amp;#147;robots.txt&amp;#148; files in&amp;nbsp;user directories, because a&amp;nbsp;robot will never look at&amp;nbsp;them. If&amp;nbsp;you want your users to&amp;nbsp;be able to&amp;nbsp;create their own&amp;nbsp;&amp;#147;robots.txt&amp;#148;, you&amp;nbsp;will need to&amp;nbsp;merge them all&amp;nbsp;into a&amp;nbsp;single &amp;laquo;/robots.txt&amp;#148;. If&amp;nbsp;you don't want to&amp;nbsp;do this your users might want to&amp;nbsp;use the&amp;nbsp;&lt;a  href="http://robotstxt.org.ru/RobotsExclusion#meta" class="" title="Robots&amp;nbsp;Exclusion">Robots META Tag&lt;/a> instead.&lt;br />
Also, remeber that URL's are&amp;nbsp;case sensitive, and&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; must be&amp;nbsp;all lower-case. &lt;br />
||Pointless robots.txt URLs||&lt;br />
||http://www.w3.org/admin/robots.txt|comment||&lt;br />
||http://www.w3.org/~timbl/robots.txt|comment||&lt;br />
||ftp://ftp.w3.com/robots.txt|comment||&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 08:37:13</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+08%3A37%3A13</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A37%3A13">2006-08-17 08:37:13&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A54%3A34">2006-08-17 08:54:34&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">Цель этого руководства &amp;ndash; помочь веб-мастерам и&amp;nbsp;администраторам в&amp;nbsp;использовании robots.txt.&lt;br />
Зто&amp;nbsp;не&amp;nbsp;спецификация &amp;ndash; подробное описание и&amp;nbsp;синтаксис можно посмотреть в&amp;nbsp;&lt;a  href="http://robotstxt.org.ru/RobotsExclusion/spec" class="" title="Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;spec">Стандарте исключений для&amp;nbsp;роботов&lt;/a>.&lt;br />
Стандарт ислючений для&amp;nbsp;роботов по&amp;nbsp;сути своей очень прост. В&amp;nbsp;кратце, это&amp;nbsp;работает следующим образом:&lt;br />
Когда робот, соблюдающий стандарт заходит на&amp;nbsp;сайт, он&amp;nbsp;прежде всего запрашивает файл с&amp;nbsp;названием &amp;laquo;/robots.txt&amp;raquo;. Если такой файл найден, Робот ищет в&amp;nbsp;нем инструкции, запрещающие индексировать некоторые части сайта.&lt;a name="h86-1">&lt;/a>&lt;h3>Где размещать файл robots.txt&lt;/h3>
Робот просто запрашивает на&amp;nbsp;вашем сайте URL&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo;, сайт в&amp;nbsp;данном случае &amp;ndash; это&amp;nbsp;определенный хост на&amp;nbsp;определенном порту.&lt;br />
||URL Сайта |Соответствующий URL&amp;nbsp;файла robots.txt ||&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">This guide is&amp;nbsp;aimed at&amp;nbsp;Web Server Administrators who&amp;nbsp;want to&amp;nbsp;use the&amp;nbsp;Robots Exclusion Protocol.&lt;br />
Note that this is&amp;nbsp;not a&amp;nbsp;specification &amp;mdash; for&amp;nbsp;details and&amp;nbsp;formal syntax and&amp;nbsp;definition see&amp;nbsp;the &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/spec" class="" title="Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;spec">specification&lt;/a>.&lt;br />
The&amp;nbsp;Robots Exclusion Protocol is&amp;nbsp;very straightforward. In&amp;nbsp;a nutshell it&amp;nbsp;works like this:&lt;br />
When a&amp;nbsp;compliant Web&amp;nbsp;Robot vists a&amp;nbsp;site, it&amp;nbsp;first checks for&amp;nbsp;a&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; URL&amp;nbsp;on&amp;nbsp;the site. If&amp;nbsp;this URL&amp;nbsp;exists, the&amp;nbsp;Robot parses its&amp;nbsp;contents for&amp;nbsp;directives that instruct the&amp;nbsp;robot not&amp;nbsp;to&amp;nbsp;visit certain parts of&amp;nbsp;the site.&lt;br />
As&amp;nbsp;a Web&amp;nbsp;Server Administrator you&amp;nbsp;can create directives that make sense for&amp;nbsp;your site. This page tells you&amp;nbsp;how.&lt;a name="h86-1">&lt;/a>&lt;h3>Where to&amp;nbsp;create the&amp;nbsp;robots.txt file&lt;/h3>
||Site URL&amp;nbsp;|Corresponding robots.txt URL&amp;nbsp;||&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 08:14:15</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+08%3A14%3A15</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A14%3A15">2006-08-17 08:14:15&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A37%3A13">2006-08-17 08:37:13&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">So, you&amp;nbsp;need to&amp;nbsp;provide the&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; in&amp;nbsp;the top-level of&amp;nbsp;your URL&amp;nbsp;space. How&amp;nbsp;to&amp;nbsp;do this depends on&amp;nbsp;your particular server software and&amp;nbsp;configuration.&lt;br />
For&amp;nbsp;most servers it&amp;nbsp;means creating a&amp;nbsp;file in&amp;nbsp;your top-level server directory. On&amp;nbsp;a UNIX machine this might be&amp;nbsp;/usr/local/etc/httpd/htdocs/robots.txt&lt;a name="h86-1">&lt;/a>&lt;h3>What to&amp;nbsp;put into the&amp;nbsp;robots.txt file&lt;/h3>
The&amp;nbsp;&amp;laquo;/robots.txt&amp;raquo; file usually contains a&amp;nbsp;record looking like this:&lt;br />
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/cgi-bin/&lt;br />Disallow:&amp;nbsp;/tmp/&lt;br />Disallow:&amp;nbsp;/~joe/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;br />
In&amp;nbsp;this example, three directories are&amp;nbsp;excluded.&lt;br />
Note that you&amp;nbsp;need a&amp;nbsp;separate &amp;#147;Disallow&amp;#148; line for&amp;nbsp;every URL&amp;nbsp;prefix you&amp;nbsp;want to&amp;nbsp;exclude &amp;mdash; you&amp;nbsp;cannot say&amp;nbsp;&amp;laquo;Disallow: /cgi-bin/ /tmp/&amp;raquo;. Also, you&amp;nbsp;may not&amp;nbsp;have blank lines in&amp;nbsp;a record, as&amp;nbsp;they are&amp;nbsp;used to&amp;nbsp;delimit multiple records.&lt;br />
Note also that regular expression are&amp;nbsp;&lt;strong>&lt;/strong>not&lt;strong>&lt;/strong> supported in&amp;nbsp;either the&amp;nbsp;User-agent or&amp;nbsp;Disallow lines. The&amp;nbsp;'*' in&amp;nbsp;the User-agent field is&amp;nbsp;a special value meaning &amp;#147;any robot&amp;#148;. Specifically, you&amp;nbsp;cannot have lines like &amp;laquo;Disallow: /tmp/*" or&amp;nbsp;&amp;laquo;Disallow: *.gif&amp;#148;.&lt;br />
What you&amp;nbsp;want to&amp;nbsp;exclude depends on&amp;nbsp;your server. Everything not&amp;nbsp;explicitly disallowed is&amp;nbsp;considered fair game to&amp;nbsp;retrieve. Here follow some examples: &lt;a name="h86-2">&lt;/a>&lt;h3>To exclude all&amp;nbsp;robots from the&amp;nbsp;entire server&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;a name="h86-3">&lt;/a>&lt;h3>To allow all&amp;nbsp;robots complete access&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;br />
Or&amp;nbsp;create an&amp;nbsp;empty &amp;laquo;/robots.txt&amp;raquo; file.&lt;a name="h86-4">&lt;/a>&lt;h3>To exclude all&amp;nbsp;robots from part of&amp;nbsp;the server&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/cgi-bin/&lt;br />Disallow:&amp;nbsp;/tmp/&lt;br />Disallow:&amp;nbsp;/private/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;a name="h86-5">&lt;/a>&lt;h3>To exclude a&amp;nbsp;single robot&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;BadBot&lt;br />Disallow:&amp;nbsp;/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;a name="h86-6">&lt;/a>&lt;h3>To allow a&amp;nbsp;single robot&lt;/h3>
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;WebCrawler&lt;br />Disallow:&lt;br />User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;a name="h86-7">&lt;/a>&lt;h3>To exclude all&amp;nbsp;files except one&lt;/h3>
This is&amp;nbsp;currently a&amp;nbsp;bit awkward, as&amp;nbsp;there is&amp;nbsp;no &amp;#147;Allow&amp;#148; field. The&amp;nbsp;easy way&amp;nbsp;is&amp;nbsp;to put&amp;nbsp;all files to&amp;nbsp;be disallowed into a&amp;nbsp;separate directory, say&amp;nbsp;&amp;#147;docs&amp;#148;, and&amp;nbsp;leave the&amp;nbsp;one file in&amp;nbsp;the level above this directory:&lt;br />
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/~joe/docs/&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;br />
Alternatively you&amp;nbsp;can explicitly disallow all&amp;nbsp;disallowed pages:&lt;br />
&lt;!--notypo-->&lt;div class="code">&lt;code>&lt;font color="#000000">
User-agent:&amp;nbsp;*&lt;br />Disallow:&amp;nbsp;/~joe/private.html&lt;br />Disallow:&amp;nbsp;/~joe/foo.html&lt;br />Disallow:&amp;nbsp;/~joe/bar.html&lt;/font>
&lt;/code>&lt;/div>&lt;!--/notypo-->&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 08:12:10</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+08%3A12%3A10</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A12%3A10">2006-08-17 08:12:10&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A14%3A15">2006-08-17 08:14:15&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">||Pointless robots.txt URLs||&lt;br />
||http://www.w3.org/admin/robots.txt|comment||&lt;br />
||http://www.w3.org/~timbl/robots.txt|comment||&lt;br />
||ftp://ftp.w3.com/robots.txt|comment||&lt;/div>&lt;br />
&lt;b>Удалено:&lt;/b>&lt;br />
&lt;div class="deletions">||Pointless robots.txt URLs ||&lt;br />
||http://www.w3.org/admin/robots.txt |comment ||&lt;br />
||http://www.w3.org/~timbl/robots.txt |comment ||&lt;br />
||ftp://ftp.w3.com/robots.txt |comment ||&lt;/div>&lt;/div>
</description>
</item>
<item>
<title>2006-08-17 08:10:09</title>
<link>http://robotstxt.org.ru/RobotsExclusion/guide/show?time=2006-08-17+08%3A10%3A09</link>
<description>&lt;div class="pageBefore">&lt;img src="http://robotstxt.org.ru/images/z.gif" width="1" height="1" border="0" alt="" style="display:block" align="top" />&lt;/div>&lt;div class="page">
&lt;b>Сравнение версий &lt;a  href="http://robotstxt.org.ru/RobotsExclusion/guide" class="">/Robots&amp;nbsp;Exclusion&amp;nbsp;/&amp;nbsp;guide&lt;/a> за &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A10%3A09">2006-08-17 08:10:09&lt;/a> и &lt;a href="http://robotstxt.org.ru/RobotsExclusion/guide?time=2006-08-17+08%3A12%3A10">2006-08-17 08:12:10&lt;/a>&lt;/b>&lt;br />
&lt;br />
&lt;b>Добавлено:&lt;/b>&lt;br />
&lt;div class="additions">||Pointless robots.txt URLs ||&lt;br />
||http://www.w3.org/admin/robots.txt |comment ||&lt;br />
||http://www.w3.org/~timbl/robots.txt |comment ||&lt;br />
||ftp://ftp.w3.com/robots.txt |comment ||&lt;/div>&lt;/div>
</description>
</item>
</channel>
</rss>
