За последние 24 часа нас посетили 67933 программиста и 1650 роботов. Сейчас ищет 901 программист ...

Подскажите советом

Тема в разделе "Прочие вопросы по PHP", создана пользователем ramen, 5 фев 2009.

  1. ramen

    ramen Активный пользователь

    С нами с:
    14 янв 2009
    Сообщения:
    16
    Симпатии:
    0
    Адрес:
    Питер
    Занимаюсь сейчас созданием партнёрской программы по переходам на просмотр страницы содержащей изображение (хостинг изображений).
    Суть партнёрской программы оплата за переход на страницу. Вопрос как можно реализовать антинакрутку страницы? Сейчас пока считает только хосты и рефера.
     
  2. _alex

    _alex Активный пользователь

    С нами с:
    29 янв 2007
    Сообщения:
    43
    Симпатии:
    0
    сессиями
     
  3. ramen

    ramen Активный пользователь

    С нами с:
    14 янв 2009
    Сообщения:
    16
    Симпатии:
    0
    Адрес:
    Питер
    Подробнее?
     
  4. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    если будут накручивать профессионально - никак. я сейчас занимаюсь трафиком (примерно твоя задача) и единственный выход - считать процен уникальностии хостов. если он превышает определенные пороги - значит траф левый.

    по другому никак, т.к. если за это платят деньги будут те, кто бдет крутить.


    подробнее:

    у тебя есть партнер, который сливает тебе траф под своим ID (надеюсь не по реферу определяешь? =) ), так вот ты считаешь уникальность IP за определенный период (я считаю за день) и если этот процент превышает определнный порог, то чначла предупреждение, а потом автоматом бан, а там уже разбираемся.
     
  5. ramen

    ramen Активный пользователь

    С нами с:
    14 янв 2009
    Сообщения:
    16
    Симпатии:
    0
    Адрес:
    Питер
    Пока никого не считаю, всё только на локалке.

    Трафик на каждый день свой каждое посещение заношу в базу данных (ip, ref, время)
     
  6. engager

    engager Активный пользователь

    С нами с:
    21 янв 2009
    Сообщения:
    1.106
    Симпатии:
    1
    Давно меня интересует вопрос. Вот допустим есть программка, которая получает на вход прокси-лист и начинает через эти прокси кликать по таргет-линкам.
    Такую программу же нереально обнаружить?
    Или я не прав?
    Возможно кто-то ведет черные списки проксей - это по-моему единственный действенный метод. И местами он используется, это факт - сам видел.
    Но с другой стороны. Откуда эти прокси берутся? Протрояненные компы.
    А если обладатель этого протояненного компа действительно хочет зайти на интересующий сайт, а его айпи забанен. К тому же многие через дхцп.
    Короче, ахтунк.
     
  7. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    я вот прямо сейчас дописываю античит в один проект и говорю со 100% гарантией, что обнаружат и забанят.
    =)

    даже если ты будешь менять время клика, агента и IP.

    поверь. против математических алгоритмов и умелых рук ни одна вша непролезет.
     
  8. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    а id юзера-то где? все остальное можно 100% подделать кроме IP, но тут как раз он и будет меняться если через проксю пойдут
     
  9. engager

    engager Активный пользователь

    С нами с:
    21 янв 2009
    Сообщения:
    1.106
    Симпатии:
    1
    440Hz
    не расскажешь примерный алгоритм? это что-то до невозможности простое или же наоборот очень сложное?
    если конечно не секрет :D
     
  10. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    анализ данных и ничего больше. есть цифры, позволяющие вычислить роботов и кликеров по их активности за определенные периоды. на их основе и вычисляется все. конечно если по разу кликнуть то пофиг, а вот если не по разу, то уже можно анализировать, но надо знать что и куда кликается. если тупой наклик н главную - одно, а если с прокликами и т.д. - другое. в общем тут целая жизнь.
     
  11. engager

    engager Активный пользователь

    С нами с:
    21 янв 2009
    Сообщения:
    1.106
    Симпатии:
    1
    сдается мне, если в реалтайме это все процессить, наверное нагрузка на сервак дополнительная будет создаваться.
     
  12. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    кто ж такое в реалтайме считает? совсем одурели? не пятница же...

    все уходит в спец таблицы и они уже обсчитываются. с трафиком в 5000000 хитов в день в онлайне за****ся считавши даже на майнфрейме.
     
  13. engager

    engager Активный пользователь

    С нами с:
    21 янв 2009
    Сообщения:
    1.106
    Симпатии:
    1
    ммм. то есть статистика созается пост-фактум. ну впринципе такой подход вполне оправдан.
    с нечто похожей идеологией я реализовал механизм по выдаче хидера Last_modified.
    Я недавно начал заниматься пхп. И спустя некоторое время обнаружил, что заголовки ответа (без буферизации вывода) можно вставлять только до первого echo, что в общем-то вполне логично.
    Но буферизацию вывода использовать почему-то не захотелось.
    Поэтому я нагородил табличку, где хранятся урлы страниц сайта с датами последней модификации. Когда скрипт стартует, он берет из таблицы это значение и пихает в хидер. Потом начинает генерить тело. По ходу этого он смотрит, не обновилась ли страница (учитываются все возможные источники обновления, типа комментов итд). Ну и если что-то изменилось, то обновляет запись в табличке. И в след. раз уже отдаст новое значение в хидере.
    Наверное я придумал велосипед )))
     
  14. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    я всегда отдаю
    PHP:
    1.  
    2. <?php
    3. header("Cache-Control: no-cache, must-revalidate"); // HTTP/1.1
    4. header("Expires: Mon, 26 Jul 1997 05:00:00 GMT"); // Date in the past
    5. ?>
    6.  
    как в учебнике написано и не парюсь, да и вообще не парюсь на счет этого.

    а лазить в базу что бы expire посчитать - ну совсем куку... Тогда следующим этапом этой паранойи надо будет удалять лишние \r\n и вообще...
    =)
     
  15. engager

    engager Активный пользователь

    С нами с:
    21 янв 2009
    Сообщения:
    1.106
    Симпатии:
    1
    про кэш-контрол, конечно, все понятно.
    но все-таки не правильно. этот хидер был придуман, чтоб HEAD-запросом спрашивать у сервера, изменилась ли страница, чтоб, если не изменилась, не запрашивать тело.
    конечно, в наш век широких каналов, это уже не так актуально.
    но, к примеру, тот же яндекс требует наличия хидера Last-Modified при регистрации в себе.
    и не понятно еще, как он (и вообще ПС) относится к тому, что Last-Modified хидер постоянно меняется, а содержимое страницы - нет.
    может он это расценивает, как попытку обмана?
     
  16. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    engager

    хочешь пофилосовствовать?
    =)
    выдавай LastModify текущую дату тогда...