За последние 24 часа нас посетил 18791 программист и 1594 робота. Сейчас ищут 1143 программиста ...

.doc, .jpeg -> html

Тема в разделе "Решения, алгоритмы", создана пользователем DmitryOlegovi4, 2 окт 2020.

  1. DmitryOlegovi4

    DmitryOlegovi4 Новичок

    С нами с:
    2 окт 2020
    Сообщения:
    1
    Симпатии:
    0
    Необходима помощь в поиске идеи/алгоритма.
    Реализацию хочу сделать сам, не знаю пока даже с чего начать )

    Задача:
    На сайт загружается некий файл (.doc, .docx, .xlsx, .jpeg и т.д.) и необходимо его содержимое отобразить на сайте (т.е. в html). Т.е. нужно распознать содержание и вывести на экран.

    В каком хоть направлении двигаться/ мыслить?

    Спасибо.
     
  2. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    xlsx это таблицы, просто выводим в таблицу.
    docx там xml в zip можно тоже прочитать и вывести в html
    doc не помню, там тоже есть свой формат
    jpeg наверное есть API у OCR софта который сразу выдаст html

    проект https://github.com/PHPOffice/PHPWord должен уметь конвертировать всё в HTML
     
    DmitryOlegovi4 нравится это.
  3. Drunkenmunky

    Drunkenmunky Активный пользователь

    С нами с:
    12 авг 2020
    Сообщения:
    1.484
    Симпатии:
    281