За последние 24 часа нас посетили 22593 программиста и 1024 робота. Сейчас ищут 711 программистов ...

Робот или нет?

Тема в разделе "PHP для новичков", создана пользователем Vladchucha, 20 фев 2019.

  1. Vladchucha

    Vladchucha Активный пользователь

    С нами с:
    12 ноя 2018
    Сообщения:
    167
    Симпатии:
    7
    Адрес:
    Nürnberg
    Все мы в какой-то степени роботы, но вот все же.
    Сделал скрипт, который записывает в таблицу БД информацию о
    пришедшем запросе от посетителя сайта. Дата, IP, домен...
    Потом статистику обрабатывать.
    Как лучше "по-простому" отличать робота от человека?
    Спасибо.
     
  2. artoodetoo

    artoodetoo Суперстар
    Команда форума Модератор

    С нами с:
    11 июн 2010
    Сообщения:
    11.072
    Симпатии:
    1.236
    Адрес:
    там-сям
    Vladchucha нравится это.
  3. Maputo

    Maputo Активный пользователь

    С нами с:
    30 июл 2015
    Сообщения:
    1.136
    Симпатии:
    173
    @artoodetoo, а как на счет кук и идентификатора сессии? Есть смысл копать в этом направлении?
     
  4. artoodetoo

    artoodetoo Суперстар
    Команда форума Модератор

    С нами с:
    11 июн 2010
    Сообщения:
    11.072
    Симпатии:
    1.236
    Адрес:
    там-сям
    @Maputo почему бы нет. надо только признать, что это бесконечная гонка между нападением и обороной ))) любая технология не абсолютна, а "достаточно хороша" в каком-то контексте.

    update: тема "робот ли это?" близка к проблеме узнавания пользователя. если пользователь никак не узнаётся, то это с большой вероятностью робот.
    если пользователь видит то, что человек не должен видеть (скрыто средствами CSS), то это скорее всего робот.
    если ты однажды по какому-то признаку отметил, что с даннного IP приходил робот, то это скорее всего робот и на тот раз ;)

    --- Добавлено ---
    про узнавание пользователя:
    https://stackoverflow.com/questions/15966812/user-recognition-without-cookies-or-local-storage обзор чего вообще есть по теме
     
    Maputo нравится это.
  5. Vladchucha

    Vladchucha Активный пользователь

    С нами с:
    12 ноя 2018
    Сообщения:
    167
    Симпатии:
    7
    Адрес:
    Nürnberg
    ОК, спасибо,
    буду дальше разбираться....
    --- Добавлено ---
    если пользователь видит то, что человек не должен видеть (скрыто средствами CSS),
    то это скорее всего робот.

    Вот это не понял. А каким образом я (PHP) узнаю,
    что на вызванной странице было увидено пользователем (роботом)?
     
  6. Valick

    Valick Активный пользователь

    С нами с:
    12 авг 2018
    Сообщения:
    1.911
    Симпатии:
    328
    @Vladchucha, на странице висит ссылка, которая скрыта средствами CSS или JS, если кто-то по ней приходит, то скорее всего это робот, чекаешь его IP-шник, и смотришь сколько с этого адреса запросов и как часто идёт обращение к сайту. Роботы обычно любят делать это побырому. В общем вычисление роботов - это комплексное решение.
     
  7. artoodetoo

    artoodetoo Суперстар
    Команда форума Модератор

    С нами с:
    11 июн 2010
    Сообщения:
    11.072
    Симпатии:
    1.236
    Адрес:
    там-сям
    скрытая ссылка, по которой челоек не перейдёт. если был переход, добавляешь IP в таблицу роботов.
     
  8. Fell-x27

    Fell-x27 Суперстар
    Команда форума Модератор

    С нами с:
    25 июл 2013
    Сообщения:
    12.155
    Симпатии:
    1.769
    Адрес:
    :сердА
    Для гугления: "bot detecting honeypot"
     
  9. Vladchucha

    Vladchucha Активный пользователь

    С нами с:
    12 ноя 2018
    Сообщения:
    167
    Симпатии:
    7
    Адрес:
    Nürnberg
    Хм... вроде понял,
    спасибо