За последние 24 часа нас посетили 233980 программистов и 1739 роботов. Сейчас ищут 1968 программистов ...

парсер документов на php

Тема в разделе "PHP для новичков", создана пользователем viktor72, 12 авг 2016.

  1. viktor72

    viktor72 Активный пользователь

    С нами с:
    20 дек 2015
    Сообщения:
    326
    Симпатии:
    6
    Необходимо парсить документы (doc , docx ) на локальном компьютере и загружать результаты на хостинг в базу mysql . на хостинге сайт с базой написанный на php .
    Подскажите, где можно почитать материал или возможно есть скрипты кем то написанные?
    Спасибо
     
  2. mr.akv

    mr.akv Активный пользователь

    С нами с:
    31 мар 2015
    Сообщения:
    1.604
    Симпатии:
    206
    можно поставить на локальный компьютер OpenServer, на php написать скрипт, парсящий doc и отправляющий в бд (если есть возможность удалённого доступа к бд), либо, если нет такого доступа, на сайте сделать некий API, куда скрипт с локалки будет отправлять данные, а уже тот скрипт записывать данные в бд.

    Если я не ошибаюсь, для парсинга .doc файлов есть библиотека PHPWord
     
    viktor72 нравится это.
  3. viktor72

    viktor72 Активный пользователь

    С нами с:
    20 дек 2015
    Сообщения:
    326
    Симпатии:
    6
    Это впринципе задача какой сложности? Боюсь моих знаний php не хватает. Насколько она может быть стоимостной?
     
  4. mahmuzar

    mahmuzar Старожил

    С нами с:
    6 апр 2012
    Сообщения:
    4.631
    Симпатии:
    425
    Адрес:
    РД, г. Махачкала.
    он не парсит вроде .doc, только docx
     
  5. mr.akv

    mr.akv Активный пользователь

    С нами с:
    31 мар 2015
    Сообщения:
    1.604
    Симпатии:
    206
    @mahmuzar, ну, у автора в списке есть docx.
    С этой библиотекой никогда не работал, только понаслышке.
    Автор, обрати внимание.
    --- Добавлено ---
    @viktor72, зависит от парсинга, насколько он будет сложен.
     
    viktor72 нравится это.
  6. askanim

    askanim Старожил

    С нами с:
    7 апр 2016
    Сообщения:
    2.201
    Симпатии:
    166
    Адрес:
    GABRIEL
    @viktor72 если ты хочешь узнать стоимость, то ты написал не в том разделе. Тебе в раздел фриланс.
     
  7. rodent90

    rodent90 Новичок

    С нами с:
    26 мар 2015
    Сообщения:
    533
    Симпатии:
    37
    Так сложилось судьбой, что doc - это бинарные данные и сними сложнее, чем с docx - это запакованный xml (открывается в два счета).
    Для знающих - это не проблема, когда имеешь с этим дело постоянно или через раз, думаю 100$-200$ это решаемо.
     
    viktor72 нравится это.
  8. askanim

    askanim Старожил

    С нами с:
    7 апр 2016
    Сообщения:
    2.201
    Симпатии:
    166
    Адрес:
    GABRIEL
    viktor72 нравится это.