За последние 24 часа нас посетили 48836 программистов и 1357 роботов. Сейчас ищут 1076 программистов ...

Закрыть доступ боту .htaccess

Тема в разделе "PHP для новичков", создана пользователем bkm, 10 апр 2013.

  1. bkm

    bkm Активный пользователь

    С нами с:
    22 окт 2009
    Сообщения:
    299
    Симпатии:
    0
    При посещении страницы кем-либо проверяю бот ли это средствами php. Если это бот я записываю его в базу.
    Постоянно приходит proximic, хочу закрыть ему доступ.
    в htaccess есть запись вида

    Код (Text):
    1. SetEnvIfNoCase User-Agent ^$ bad_bot
    2. SetEnvIfNoCase User-Agent "^proximic" bad_bot
    3.  
    4. <Limit GET POST HEAD>
    5.     Order Allow,Deny
    6.     Allow from all
    7.     Deny from env=bad_bot
    8. </Limit>
    но бот все равно фигурирует в логах страницы (запись в бд создается), значит ли это, что правило не работает?
    или он все таки идет лесом, просто php раньше отрабатывает?
     
  2. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
    а robots.txt ему дать прожевать? офсайт говорит что он не из глупых
     
  3. bkm

    bkm Активный пользователь

    С нами с:
    22 окт 2009
    Сообщения:
    299
    Симпатии:
    0
    1. взгляд параноика - не факт, что боты не индексируют сайт с запретом в robots.txt, они это могут тщательно скрывать.
    2. это может происходить необязательно с proximic, так и с другими ботами, менее честными.

    В вопросе больше уклон на правило, работает или нет, исключил символ ^ будем смотреть.
     
  4. Ganzal

    Ganzal Суперстар
    Команда форума Модератор

    С нами с:
    15 мар 2007
    Сообщения:
    9.893
    Симпатии:
    965
    мне не нравится эта регулярка. походу бэдбот не устанавливается из-за того что эту строку надо не в начале а в середине строки искать так что должно помочь как раз: