Определение поисковых ботов

inline · 23 дек 2010

Как средствами пхп можно определить посетителя сайта - поисковый бот или обычный юзер?

LeoK · 23 дек 2010

смотреть $_SERVER['HTTP_USER_AGENT']

inline · 23 дек 2010

LeoK сказал(а):

смотреть $_SERVER['HTTP_USER_AGENT']
Нажмите, чтобы раскрыть...

не 100% вариант
ботов всяких разных несколько десятков

inline · 23 дек 2010

может если $_SERVER['HTTP_REFERER'] пустой
но тут те кто с закладок пришли попадут

LeoK · 23 дек 2010

а 100% варианта и нету... если у ТС задача определять поисковых ботов, то у более менее известных ПМ как правило есть стандартная сигнатура для $_SERVER['HTTP_USER_AGENT'] и принадлежность тому либо иному проверяется на вхождение этой сигнатуры в $_SERVER['HTTP_USER_AGENT'].

Devzirom · 23 дек 2010

100% только ip. Но имейте ввиду, что у одного поисковика не один ip адрес и они могут меняться время от времени.

VItalijs · 23 дек 2010

и того способ тоже не 100%, походу в web очень тяжело что-то сказать о пользователе со 100% вероятностью, ибо все это можно подменить. Можно просто проверить возможный максимум каких-то параметров, которым можно доверять, и все время добавлять разные механизмы проверок информации что бы что-то знать о пользователе..

inline · 23 дек 2010

а если проверять браузер через который смотрели
и если браузер не известен, то значит бот
а как сервисы статистики ботов определяют?

LeoK · 23 дек 2010

тут сигнатуры http://www.fromtlt.ru/news/3/5/ для http_user_agent

погуглиш найдёш для браузеров - т.е. обычных пользователей (не факт!)
100% ничего не узнаеш прими это как есть

inline · 23 дек 2010

а может проверять http_user_agent на наличие записи о Windows - заметил, что у ботов версия винды не указана

Volt(220) · 23 дек 2010

inline
Т.е. все кто не под Windows сидит - боты? =))

VItalijs · 23 дек 2010

ботом можно тоже в user agent что угодно прописать, с windows конечно забавный вариант =))

inline · 23 дек 2010

Volt(220) сказал(а):

Т.е. все кто не под Windows сидит - боты? =))
Нажмите, чтобы раскрыть...

да нет конечно
но глянул по стате сайта на Ли - 99% виндовые юзверя

inline · 23 дек 2010

VItalijs сказал(а):

ботом можно тоже в user agent что угодно прописать, с windows конечно забавный вариант =))
Нажмите, чтобы раскрыть...

кому нужно инет-магазин парсить?

LeoK · 23 дек 2010

Volt(220) сказал(а):

inline
Т.е. все кто не под Windows сидит - боты? =))
Нажмите, чтобы раскрыть...

Я бот

24/7 · 24 дек 2010

USER AGENT можно указать любой, с IP непонятно как определить откуда следует ожидать поисковых ботов, REFFERER не все браузеры проставляют, по винде тоже понятно почему не стоит проверять. А можно поинтересоваться, зачем вам это нужно? Обычно поисковые боты проставляют свой user agent, так что я бы склонялся к этому варианту. Но опять же вопрос, зачем? Если вы хотите запретить индексировать определенные страницы вашего сайта, я бы предложил прописать эти страницы в robots.txt ну и вообще, двигаться в этом направлении

karlozzz · 24 дек 2010

Определить можно только тех ботов, кто этого хочет, яндекс спайдер, гуголь спайдер итд, они не скрываются, а вот если я напише паука который эмулирует все на 100% как у броузера, тогда уж извини, никак не определишь, я это или паук))

Определение поисковых ботов

inline Активный пользователь

LeoK Активный пользователь

inline Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

Devzirom Активный пользователь

VItalijs Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

inline Активный пользователь

Volt(220) Активный пользователь

VItalijs Активный пользователь

inline Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

24/7 Активный пользователь

karlozzz Активный пользователь

Быстрый поиск

Определение поисковых ботов

inline Активный пользователь

LeoK Активный пользователь

inline Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

Devzirom Активный пользователь

VItalijs Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

inline Активный пользователь

Volt(220) Активный пользователь

VItalijs Активный пользователь

inline Активный пользователь

inline Активный пользователь

LeoK Активный пользователь

24/7 Активный пользователь

karlozzz Активный пользователь