Необходимо указать file_put_contents значение так, чтобы экспортируемый txt-документ был назван по значению, взятому из переменной (в конкретном случае $url=http://*.ru/). Как же это сделать? Да еще и с указанием нужного расширения (.txt)?
передать переменную как аргумент функции, ну если там есть запрещённые символы, можно от них избавится, ты не всю задачу описал, тебе просто файл назвать именем домена нужно?
Помогли разобраться в вопросе, но возник другой. А если одновременно собрать данные с нескольких порталов при помощи file_get_contents? Как рассортировать данные по .txt-документам, названным в соответствии с доменным именем "портала-родителя"? Возможно без присвоения каждому порталу уникальной переменной?
Ну дык адрес портала и есть уникальное имя файла. В чем проблема? --- Добавлено --- У нас вообще воровство контента не в почёте, так что выписываю тебе рекомендацию использовать апи этих порталов. Иначе эти порталы - жертвы, а ты - вор.
Мне не нужен контент сам по себе. Мне нужно знать какие слова употребляются на странице с целью определить принадлежность портала к коммерческой или информационной тематике.
@Razorfen ты как сервис рейтинга? Тут нужно писать имя своего бота в user agent и ссылку на документацию по robots.txt, как показать твоему боту, что владельцы сайта не хотят, чтобы ты их сканировал.
В таких случаях юзают либо хеширование, либо перевод в другую кодировку, или как вариант base64, благо Линукс не путает большие и маленькие буквы в именах файлов. Но по уму, сохранять файл под неким случайным назавнием или хэшем, а в бд писать соответствие этого хеша и некой другой информации, например урлов, аккаунта, имени, любимой собачки и т.п.
как минимум проверять robots.txt, чтобы там отсутствовал запрет для всех ботов, потому что могут разрешить только google и yandex ботам сканировать, а всем другим запрет.
@denis01 полагаю автору глубоко настрать на других. Да и "исследовательская... для себя" вполне может обернуться простым воровством.
Вы совершенно не компетентны в этом вопросе, что закономерно и нормально, учитывая тематику форума. А поэтому подобные громкие выводы за собой ничего не несут. Предлагаю прекратить офф-топ модераторам и закрыть тему, так как вышеуказанный вопрос решен.