Рекурсивный акроним словосочетания «PHP: Hypertext Preprocessor»

Добро пожаловать на форум PHP программистов!

За последние 24 часа нас посетили 22862 программиста и 1237 роботов. Сейчас ищут 695 программистов ...

Menu
Форум
Форум

Быстрые ссылки
- Поиск сообщений
- Последние сообщения
Искать только в заголовках

Сообщения пользователя:

Имена участников (разделяйте запятой).

Новее чем:

Искать только в этой теме

Искать только в этом разделе

Отображать результаты в виде тем

Больше...

Быстрый поиск

Последние сообщения
Пользователи
Пользователи

Быстрые ссылки
Меню

Формирование XML для поточного индексирования

Тема в разделе "PHP для новичков", создана пользователем nikolaypronchev, 25 июн 2018.

Метки:

nikolaypronchev Новичок

С нами с:

25 июн 2018

Сообщения:

1

Симпатии:

0

Имеется большое количество книг (>10000) в формате pdf, и поисковый движок Sphinx. Требуется проиндексировать содержимое книг для полнотекстового поиска.
Данные для индексирования удобно передавать в формате XML, однако объем XML в таком случае слишком велик для работы.
Попробовав подавать на индексацию поток XML, формируемый в php-скрипте, столкнулся с ошибкой "not well-formed (invalid token)". Есть ли резон искать ошибки в формировании потока или лучше индексировать кусками?
Спасибо.

#1 nikolaypronchev, 25 июн 2018

(Вы должны войти или зарегистрироваться, чтобы разместить сообщение.)