Необходима помощь в поиске идеи/алгоритма. Реализацию хочу сделать сам, не знаю пока даже с чего начать ) Задача: На сайт загружается некий файл (.doc, .docx, .xlsx, .jpeg и т.д.) и необходимо его содержимое отобразить на сайте (т.е. в html). Т.е. нужно распознать содержание и вывести на экран. В каком хоть направлении двигаться/ мыслить? Спасибо.
xlsx это таблицы, просто выводим в таблицу. docx там xml в zip можно тоже прочитать и вывести в html doc не помню, там тоже есть свой формат jpeg наверное есть API у OCR софта который сразу выдаст html проект https://github.com/PHPOffice/PHPWord должен уметь конвертировать всё в HTML