robots.txt - указывает поисковым роботам какие каталоги брать для индексации не следует. Если пуст или не существует, то все можно брать. Поисковые сервера всегда перед индексацией вашего ресурса ищут в корневом каталоге вашего домена файл с именем "robots.txt" (именно с маленькой бувы) (http://www.mydomain.com/robots.txt). Этот файл сообщает роботам (паукам-индексаторам), какие файлы они могут индексировать, а какие нет.
robots.txt состоит из двух полей: User-agent - название робота, Disallow - запрет на индексирование файла или директории. Комментарии - начинаются с новой строки с #.
Редакторы robots.txt должен создаваться в текстовом формате. В качестве редактора можно использовать блокнот, FTP-клиент, некоторые HTML-редакторы.
Название robots.txt, а не robot.txt или Robots.txt, иначе не будет работать.
Местонахождение Файл robots.txt должен располагаться в корневом каталоге.
Пробелы <Поле> ":" <значение> Пробелы не имеют значения.
Комментарии Комментарии - начинаются с новой строки с #. Пробел после # не обязателен.
Порядок 1-я строка User-agent, которая определяет робота, а последующая Disallow определяет файл или папку, закрытую для индексирования.
Если запрет относится к ряду роботов, то они пишутся один за одним отдельно, а потом запрет или перечень запретов, например:
Code
User-agent: StackRambler User-agent: Aport Disallow: /eng Disallow: /news #Рамблеру и Апорту запретить индексацию ссылок, #которые начинаются с /news и /eng
То же самое и для Disallow - каждый запрет с новой строчки.
Если же для разных роботов разные запреты, то они разделяются пустой строкой, например:
Code
User-agent: * Disallow: /news # запретить всем роботам индексировать ссылки, #которые начинаются с /news
Code
User-agent: StackRambler User-agent: Aport Disallow: /eng Disallow: /news #Рамблеру и Апорту запретить индексацию ссылок, #которые начинаются с /news и /eng
МЕТА тег robots служит для того, чтобы разрешать или запрещать роботам, приходящим на сайт, индексировать данную страницу. Кроме того, этот тег предназначен для того, чтобы предлагать роботам пройтись по всем страницам сайта и проиндексировать их. Сейчас этот тег приобретает все большее значение.