Здрасти всем! Мне нужно написать скрипт который бы производил чтение из .doc файла и записывал эту инфу в БД. Но проблема в том, что вордовский документ - это таблица (в которой есть ячейки, в которых данные расположены в несколько строк и столбцов в одной ячейке). Причем я не могу просто считать эти данные т.к. они будут считаны в одну строчку. А мне нужно точно знать расположение исходных данных в документе. Структура таблицы мне известна. Как мне считать эти данные? Может быть попробывать поработать с XML документами или нужно использовать Perl или еще чего нибудь. Поделитесь мыслями, потому что у меня они уже кончились... :?
Это сложно, даже очень сложно. Вариант 1 - перегнать в csv: Код (Text): // Если XLS, то перекатим в текст и подставим его // starting excel $excel = new COM("excel.application") or die("Unable to instanciate excel"); //bring it to front #$excel->Visible = 0;//NOT //dont want alerts ... run silent $excel->DisplayAlerts = 0; //open document $excel->Workbooks->Open($fileIn); //XlFileFormat.xlcsv file format is 6 //saveas command (file,format ......) $excel->Workbooks[1]->SaveAs($fileIn.".csv",6); //closing excel $excel->Quit(); //free the object $excel->Release(); $excel = null; вариант 2 - также, но перегнать в html, почистить вордовый хлам и разобрать таблицу вариант 3 - распотрошить сам DOC Успехов! Поделись если удасться 3 вариант ajk.by.ru - просто красивые фотки