За последние 24 часа нас посетили 18198 программистов и 1582 робота. Сейчас ищут 1157 программистов ...

Чтение данных из документа Word

Тема в разделе "PHP для новичков", создана пользователем KInika, 14 дек 2007.

  1. KInika

    KInika Активный пользователь

    С нами с:
    22 ноя 2007
    Сообщения:
    2
    Симпатии:
    0
    Адрес:
    г.Рудный
    Здрасти всем!
    Мне нужно написать скрипт который бы производил чтение из .doc файла и записывал эту инфу в БД.
    Но проблема в том, что вордовский документ - это таблица (в которой есть ячейки, в которых данные расположены в несколько строк и столбцов в одной ячейке). Причем я не могу просто считать эти данные т.к. они будут считаны в одну строчку. А мне нужно точно знать расположение исходных данных в документе. Структура таблицы мне известна.
    Как мне считать эти данные? Может быть попробывать поработать с XML документами или нужно использовать Perl или еще чего нибудь.
    Поделитесь мыслями, потому что у меня они уже кончились... :?
     
  2. QQQ

    QQQ Активный пользователь

    С нами с:
    21 ноя 2007
    Сообщения:
    538
    Симпатии:
    0
    если это вЫнь - то копай в сторону COM
     
  3. KInika

    KInika Активный пользователь

    С нами с:
    22 ноя 2007
    Сообщения:
    2
    Симпатии:
    0
    Адрес:
    г.Рудный
    В PHP я новичок. :)
    Так что если можно поподробнее
     
  4. ajk

    ajk Активный пользователь

    С нами с:
    5 дек 2007
    Сообщения:
    6
    Симпатии:
    0
    Адрес:
    Коломна, Россия
    Это сложно, даже очень сложно.
    Вариант 1 - перегнать в csv:
    Код (Text):
    1.  
    2.    // Если XLS, то перекатим в текст и подставим его
    3.    // starting excel
    4.    $excel = new COM("excel.application") or die("Unable to instanciate excel");
    5.  
    6.    //bring it to front
    7.    #$excel->Visible = 0;//NOT
    8.    //dont want alerts ... run silent
    9.    $excel->DisplayAlerts = 0;
    10.  
    11.    //open  document
    12.    $excel->Workbooks->Open($fileIn);
    13.    //XlFileFormat.xlcsv file format is 6
    14.    //saveas command (file,format ......)
    15.    $excel->Workbooks[1]->SaveAs($fileIn.".csv",6);
    16.  
    17.    //closing excel
    18.    $excel->Quit();
    19.  
    20.    //free the object
    21.    $excel->Release();
    22.    $excel = null;
    вариант 2 - также, но перегнать в html, почистить вордовый хлам и разобрать таблицу

    вариант 3 - распотрошить сам DOC

    Успехов! Поделись если удасться 3 вариант

    ajk.by.ru - просто красивые фотки