Кто-нибудь встречал решения на php либо в виде экстеншена для чтения doc, docx, odt и т.п. файлов? Нужно получить только текст. Хочу организовать индексацию документов для поиска. К exec хотелось бы прибегнуть в крайнем случае.
Подсказки по opensource поисковым движкам, которые умеют индексировать такие документы то же приветствуются.
У меня есть парсер doc файлов. Бинарников. Одно но - разбирает только doc, созданный в word'e . Не разбирает doc, созданный в OpenOffice. Нужен?
MNOGOSEARCH делает все, но за чсет внешних программ. Под фрей. Я прикручивал DOC,PDF.XLS и т.д. когда поиск на php.ru делал. потом отключил.
еще не знаю, то ли я с чем-то путаю то ли нет, но есть тупо родные билы, которые читают, только их апи не описаны достаточно...