Ответ 1
Там ничего не будет работать для всех сканеров. Есть два варианта, которые могут быть полезны для вас.
Роботы, которые допускают подстановочные знаки, должны поддерживать что-то вроде:
Disallow: /*/
Основные поисковые роботы понимают подстановочные знаки, но, к сожалению, большинство из них не имеют.
Если у вас относительно мало файлов в корневом каталоге, и вы не часто добавляете новые файлы, вы можете использовать Allow
, чтобы разрешить доступ к этим файлам, а затем использовать Disallow: /
, чтобы ограничить все остальное. То есть:
User-agent: *
Allow: /index.html
Allow: /coolstuff.jpg
Allow: /morecoolstuff.html
Disallow: /
Порядок здесь важен. Предполагается, что сканеры пройдут в первом матче. Поэтому, если ваше первое правило было Disallow: /
, искатель с корректным поведением не попадал бы в следующие строки Allow
.
Если искатель не поддерживает Allow
, он увидит Disallow: /
и не сканирует что-либо на вашем сайте. Предоставляя, конечно, что он игнорирует вещи в robots.txt, которые он не понимает.
Все основные поисковые роботы поддерживают Allow
, и многие из них тоже делают. Это легко реализовать.