Вот что мне надо. Скрипт бота, который сканит сайты и копирует их содержание. url'ы сайтов будут храниться в бд, в отдельной таблице. Код (Text): CREATE TABLE `sites` ( `id` int(11) NOT NULL auto_increment, `site_url` varchar(100) NOT NULL default '', PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=cp1251 AUTO_INCREMENT=31 ; Основная задача скопировать содержание всех страниц к в бд. примерно так: Код (Text): -- -- Структура таблицы `sites_index` -- CREATE TABLE `sites_index` ( `site_id` varchar(10) NOT NULL default '', `page_u` varchar(10) NOT NULL, `page_url` text NOT NULL, `title` text NOT NULL, `content` text NOT NULL, `internal_links` text NOT NULL ) ENGINE=MyISAM DEFAULT CHARSET=cp1251; site_id - все понятно. page_u - уровень данной страници. ПАРСИНГ ИДЕТ ДО 4Х УРОВНЕЙ! page_url - текущий url пропарсеной страници. title - заголовок этой страници, если его нет, то подставляется url. content - весь контент страници, без html тегов. потом сразу идет список внешних ссылок. после основного контента. internal_links - это ссылки на внтутренные страници. (чТОБЫ БРАТЬ ИНФУ И ДАЛЬШЕ ИНДЕКСИТЬ) ваще скоко это стоит?[/code]
Как говорил Пикассо - цена исходит из времени,потраченном на обучение,а не из времени,потраченном на разработку А цену я сказал практично, с учётом "торга" + мелких деталей,которые всплывают позже.Если сказать что возмёшь 10$ то ито с тебя будут пытаться выторговать "скидку" и останутся недовольными если не сделаешь,а если скажешь 150 и потом сделаешь скидку в $50,то еще и довольным клиент останется. Самое главное маркетинговый подход и психология ))
Belegnar, вы готовы за 10 сделать? Amian, интересна скорость работы скрипта и минимальные нагрузки на системные ресурсы. сколько примерно будет уходить на сайт, если там 1500 страниц по 40кб(ну если все теги снять, то все 3кб будет)?
Узкое место - connection, за сколько установит 1500 соединений и скачает 60мб, примерно за столько и выполнит.Если все страницы сканить до 4го уровня,то нужно умножить на 4 само собой ,а убирание тэгов происходит только после скачивания всего содержимого странички.
Вообще на тему стоимости могу сказать так... (задолбали разговоры о том что "дороже лучше", это не совсем так) 1 - скрипт (лишь бы работало) это реально час работы 2 - скрипт хорошего качества это не только сам скрипт но и грамотное проектирование (до того как начать писать) тестирование (после того как написал) при необходимости доработка (по результатам тестирования) И если в первом случае это реально То во втором случае это уже реально серьёзная и долгая работа и тут мало того бюджет будет выше, но и отбор кандидатов на написание нужно проводить качественно (чтоб не нанять на такую ответственную работу ламера) а это также финансовые затраты...