За последние 24 часа нас посетили 20874 программиста и 1671 робот. Сейчас ищут 1059 программистов ...

нужно написать парсер.

Тема в разделе "PHP Free-Lance", создана пользователем kon, 22 май 2007.

  1. kon

    kon Активный пользователь

    С нами с:
    5 апр 2007
    Сообщения:
    11
    Симпатии:
    0
    Приветствую.
    Ситуация такая: необходимо написать парсер по логам.
    как должен работать:

    вбиваем строку поиска по логам, далее выбираем место поиска(все хранится в текстовых файлах), программа начинает поиск, и каждый раз когда встречает строку копирует ее в отдельный файл, при этом нужно чтобы он имел возможность выдирать необходимое количество строк до строки поиска и после.
    Прога должна уметь работать с крупными файлами, до 800 мегабайт файл.

    Подробности по почте. С предложениями : drcxroup@mail.ru / Dima.
    сразу говорите сумму которую хотели бы за этот скрипт и время на реализацию
     
  2. avm

    avm Активный пользователь

    С нами с:
    21 сен 2006
    Сообщения:
    597
    Симпатии:
    0
    Адрес:
    Москва
    $500, в тот же день
     
  3. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    grep "MSIE" *

    =)))
     
  4. vasa_c

    vasa_c Активный пользователь

    С нами с:
    22 мар 2006
    Сообщения:
    1.760
    Симпатии:
    0
    Адрес:
    гор.Ленинград
    440Hz, испортил avm весь бизнес )
     
  5. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    ну да. хрен ли парня мутить?

    Код (Text):
    1.  
    2. hosting(root):/usr/local/etc/nginx/logs#>lsl | grep php.ru
    3. -rw-r--r--  1 root  wheel  374861434 22 май 15:18 php.ru.access.log
    4. -rw-r--r--  1 root  wheel          0 12 апр 10:47 php.ru.error.log
    5. -rw-r--r--  1 root  wheel  379483702 22 май 15:18 php.ru.images.log
    6. hosting(root):/usr/local/etc/nginx/logs#>grep 'Opera' php.ru.access.log | wc -l
    7.   246798
    8. hosting(root):/usr/local/etc/nginx/logs#>grep 'MSIE' php.ru.access.log | wc -l
    9.   681562
     
  6. stas_t

    stas_t Активный пользователь

    С нами с:
    24 апр 2007
    Сообщения:
    500
    Симпатии:
    0
    Адрес:
    Courbevoie, France
    да ладно! опера -- треть от эксплорера! быть не может. процентов 5 должно быть
     
  7. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    я ж не сам это придумал

    Код (Text):
    1.  
    2. hosting(root):/usr/local/etc/nginx/logs#>grep 'Lynx' php.ru.access.log | wc -l
    3.       39
     
  8. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
     
  9. stas_t

    stas_t Активный пользователь

    С нами с:
    24 апр 2007
    Сообщения:
    500
    Симпатии:
    0
    Адрес:
    Courbevoie, France
    это за когда?
     
  10. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    первая запись:

    hosting(root):/usr/local/etc/nginx/logs#>head -n 1 php.ru.access.log
    89.208.19.4 - [12/Apr/2007:10:48:05 +0400] "GET /manual/function.ncurses-echochar.html HTTP/1.1" 200 4422 "-" "WebAlta Crawler/1.3.30 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)" "2.28"
     
  11. stas_t

    stas_t Активный пользователь

    С нами с:
    24 апр 2007
    Сообщения:
    500
    Симпатии:
    0
    Адрес:
    Courbevoie, France
    gecko, по идее, должен ie сделать... я думаю, раза в два
     
  12. stas_t

    stas_t Активный пользователь

    С нами с:
    24 апр 2007
    Сообщения:
    500
    Симпатии:
    0
    Адрес:
    Courbevoie, France
    может, голосование объявим, кто более точную цифру даст? я даю 1'363'124
     
  13. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    Код (Text):
    1. hosting(root):/usr/local/etc/nginx/logs#>grep 'Gecko' php.ru.access.log | wc -l
    2.   295471
    3. hosting(root):/usr/local/etc/nginx/logs#>grep 'Mozilla' php.ru.access.log | wc -l
    4.  1226093
    эт к тому, что человеку парсер был нужен...
    =)
     
  14. stas_t

    stas_t Активный пользователь

    С нами с:
    24 апр 2007
    Сообщения:
    500
    Симпатии:
    0
    Адрес:
    Courbevoie, France
    ну так вот ему и парсер, и примеры использования для "уметь работать с крупными файлами"

    кстати, пардон, а в мозилле разве нет вхождения "gecko"? или там [Gg] ?

    p.s. ну вот, голосования не получилось...

    p.p.s. прости, avm...
     
  15. avm

    avm Активный пользователь

    С нами с:
    21 сен 2006
    Сообщения:
    597
    Симпатии:
    0
    Адрес:
    Москва
    stas_t, да мне пох :D
    хотя немного жаль что отдали даром... :lol:
     
  16. kon

    kon Активный пользователь

    С нами с:
    5 апр 2007
    Сообщения:
    11
    Симпатии:
    0
    Ребята я примерно в курсах всех цен. конечно про 500 ты прикольнул. спасибо за код .
    440hz стукни пожалуйста мне в icq : 236259676. заплачу тебе за полную реализацию кода 100 $ . так сказать за доброту твоего характера.
     
  17. Петр

    Петр Активный пользователь

    С нами с:
    20 мар 2006
    Сообщения:
    1.253
    Симпатии:
    0
    Адрес:
    Центр Вселенной
  18. 440Hz

    440Hz Старожил
    Команда форума Модератор

    С нами с:
    21 дек 2012
    Сообщения:
    8.003
    Симпатии:
    1
    Адрес:
    Оттуда
    старик. я от 1000$ начинаю разговор.
     
  19. kon

    kon Активный пользователь

    С нами с:
    5 апр 2007
    Сообщения:
    11
    Симпатии:
    0
    от 1000 я бы тебе несколько другой код попросил написть :)
    у этого кода красная цена 100. и это еще по большой щедрости.

    Есть другие желающие?
     
  20. tf_k

    tf_k Активный пользователь

    С нами с:
    4 дек 2006
    Сообщения:
    22
    Симпатии:
    0
    брр