Парсинг товара phpQuery

OrionNk · 25 апр 2018

Люди помогите и подскажите как у vypileno спарсить цену товара и сроки.
Я в браузере фаербагом теги страницы вижу все, а phpquery видит только шапку и футер страницы.

PHP:

$url = 'http://vypileno.ru';

$file = file_get_contents($url);

echo $file;

acho · 25 апр 2018

Уже ж было сказано: на форуме запрещены обсуждения парсинга.

Deonis · 25 апр 2018

Fell-x27 сказал(а): ↑

Парсерщики должны страдать.
Нажмите, чтобы раскрыть...

(@Fell-x27, Полное собрание сочинений, 2013 год, Том пятый.)

Fell-x27 · 25 апр 2018

OrionNk сказал(а): ↑

Люди помогите и подскажите как у эмекса спарсить цену товара и сроки.
Нажмите, чтобы раскрыть...

Никак.
Обращайтесь к владельцам сайта с просьбой предоставления API, заключайте партнерство.

OrionNk · 25 апр 2018

Fell-x27 сказал(а): ↑

Никак.
Обращайтесь к владельцам сайта с просьбой предоставления API, заключайте партнерство.
Нажмите, чтобы раскрыть...

Да, вы правы, есть официальные АПИ у поставщиков и они предоставляют их нам, но для этого нужно обращаться к сторонним ПХП разработчикам. Учитывая, что я владелец провинциального небольшого магазина запчастей, позволить себе держать в штате или обратится к сторонним программерам за разработкой подключения и поддержания оф. АПИ пока не имею возможности. Но имея базовые знания в ПХП написал для себя небольшой парсер который собирает цены всех моих поставщиков (8 шт.) на одной странице, чтобы мне не лазить по 8-ми сайтам поставщиков и сравнивать цены. Что плохого в этом? Парсер я не продаю, использую в личных целях, нагрузку на сайты не создаю. И с высказыванием "Парсерщики должны страдать." я не совсем согласен. Да и запрет обсуждение данной темы на форуме тоже глупость, может я конечно чего то не понимаю. Парсинг есть, и библиотеки для него есть и регулярные выражения так зачем стесняться его обсуждать? Это как... пердят все, НО в "светском" обществе об этом не принято говорить, типа никто не пердит )) Ладно, удаляй или закрывай тему. А правила прочту на будущее.

nospiou · 25 апр 2018

запретить обсуждения парсинга в php это как отрубить горынычу сразу три головы

Fell-x27 · 25 апр 2018

OrionNk сказал(а): ↑

Учитывая, что я владелец провинциального небольшого магазина запчастей, позволить себе держать в штате или обратится к сторонним программерам за разработкой подключения и поддержания оф. АПИ пока не имею возможности.
Нажмите, чтобы раскрыть...

Наймите фрилансера, прикрутить API - не гору свернуть. Справится.

OrionNk сказал(а): ↑

Парсинг есть, и библиотеки для него есть и регулярные выражения так зачем стесняться его обсуждать?
Нажмите, чтобы раскрыть...

Мы не стесняемся, все проще.
Есть Вася. У Васи есть сайт. Вася кровью потеет, наполняя сайт контентом. Все руками обновляет, делает, собирает инфу и тд.
Есть Петя. Петя хитрый. Петя не хочет потеть кровью. Петя парсит контент Васи и наживается на его трудах, плюя в потолок.

Есть Гугл. Гугл, по несчастливой иронии, запросто может выдачу Пети сделать более релевантной, чем выдачу Васи. Особенно, если Петя хитрый и всячески продвигает себя, пока Вася потеет кровью.

Как следствие, потеет Вася, а стрижет купоны Петя.

Мы не стесняемся парсинга как явления. Мы не любим Петю. И хотим, чтобы Петь было как можно меньше.

nospiou · 26 апр 2018

@Fell-x27 А зачем Васи асинхронный контент который гугл не анализирует? Или это спрятанная статика? Иногда встречаю сайты на которых копирования запрещено js. Такая паранойя. Кому нужно тот все равно стащит.

Deonis · 26 апр 2018

nospiou сказал(а): ↑

Кому нужно тот все равно стащит.
Нажмите, чтобы раскрыть...

Ебистественно. Только помогать ему в этом и упростить задачу - как-то западло... Тем более, что лично я как-то уже побывал в шкуре "Васи" и до боли знакома описанная ситуация @Fell-x27:

Fell-x27 сказал(а): ↑

Гугл, по несчастливой иронии, запросто может выдачу Пети сделать более релевантной, чем выдачу Васи
Нажмите, чтобы раскрыть...

P.S.

nospiou сказал(а): ↑

асинхронный контент который гугл не анализирует?
Нажмите, чтобы раскрыть...

Ошибочное предположение. Не буду говорить про остальные поисковики, но гугл кушает динамически подгружаемый контент аж со свистом. Проверено лично опытным путем, а два года назад - с двумя скептиками. А еще годом ранее, как оказалось, эксперимент провели другие ребята с положительным результатом (если кому нужно, то перевод статьи).

nospiou · 26 апр 2018

@Deonis Пробежался по быстрому нету там тестов для асинхронного кода (для данных которые подгружаются по api)

Deonis · 26 апр 2018

@nospiou, это далеко не первая дискуссия, где я принимаю участие в обсуждении этой темы и, честно говоря, уже устал подустал от повторяющихся ситуаций. Я буду только двумя руками "за", если вы сделаете свои тесты и поделитесь ими, т.к. для меня важнее реальное положение дел на этом фронте, а не держаться зубами за свою точку зрения.

nospiou · 26 апр 2018

Deonis сказал(а): ↑

@nospiou, это далеко не первая дискуссия, где я принимаю участие в обсуждении этой темы и, честно говоря, уже устал подустал от повторяющихся ситуаций. Я буду только двумя руками "за", если вы сделаете свои тесты и поделитесь ими, т.к. для меня важнее реальное положение дел на этом фронте, а не держаться зубами за свою точку зрения.
Нажмите, чтобы раскрыть...

Не в тех участвовал. Я уже много раз бросал ссылки на то как сейчас работает гугл. ajax ws он не дожидается. Ситуация с яндекс еще хуже.

romach · 26 апр 2018

nospiou сказал(а): ↑

Я уже много раз бросал ссылки на то как сейчас работает гугл
Нажмите, чтобы раскрыть...

м?

nospiou · 26 апр 2018

romach сказал(а): ↑

м?
Нажмите, чтобы раскрыть...

Ну вот одна из них на твоем любимом vue https://ssr.vuejs.org/ru/

Виктор_Fed · 30 апр 2018

OrionNk сказал(а): ↑

Люди помогите и подскажите как у vypileno спарсить цену товара и сроки.
Я в браузере фаербагом теги страницы вижу все, а phpquery видит только шапку и футер страницы.

PHP:

$url = 'http://vypileno.ru';

$file = file_get_contents($url);

echo $file;

Нажмите, чтобы раскрыть...

Вкладочка network(Chrome) вам в помощь. Нужно ловить адреса запросов, и парсить уже их. Возможно, что потребуется знания регулярок. Ну либо обратиться к фрилансерам.
--- Добавлено ---

Fell-x27 сказал(а): ↑

Наймите фрилансера, прикрутить API - не гору свернуть. Справится.

Мы не стесняемся, все проще.
Есть Вася. У Васи есть сайт. Вася кровью потеет, наполняя сайт контентом. Все руками обновляет, делает, собирает инфу и тд.
Есть Петя. Петя хитрый. Петя не хочет потеть кровью. Петя парсит контент Васи и наживается на его трудах, плюя в потолок.

Есть Гугл. Гугл, по несчастливой иронии, запросто может выдачу Пети сделать более релевантной, чем выдачу Васи. Особенно, если Петя хитрый и всячески продвигает себя, пока Вася потеет кровью.

Как следствие, потеет Вася, а стрижет купоны Петя.

Мы не стесняемся парсинга как явления. Мы не любим Петю. И хотим, чтобы Петь было как можно меньше.
Нажмите, чтобы раскрыть...

Мир жесток детка. Не надо быть таким Васей

Парсинг товара phpQuery

OrionNk Новичок

acho Активный пользователь

Deonis Старожил

Fell-x27 Суперстар
Команда форума Модератор

OrionNk Новичок

nospiou Старожил

Fell-x27 Суперстар
Команда форума Модератор

nospiou Старожил

Deonis Старожил

nospiou Старожил

Deonis Старожил

nospiou Старожил

romach Старожил

nospiou Старожил

Виктор_Fed Новичок

Быстрый поиск

Парсинг товара phpQuery

OrionNk Новичок

acho Активный пользователь

Deonis Старожил

Fell-x27 Суперстар Команда форума Модератор

OrionNk Новичок

nospiou Старожил

Fell-x27 Суперстар Команда форума Модератор

nospiou Старожил

Deonis Старожил

nospiou Старожил

Deonis Старожил

nospiou Старожил

romach Старожил

nospiou Старожил

Виктор_Fed Новичок

Fell-x27 Суперстар
Команда форума Модератор

Fell-x27 Суперстар
Команда форума Модератор