За последние 24 часа нас посетили 17519 программистов и 1707 роботов. Сейчас ищут 1634 программиста ...

Чистка тэгов MS Office средствами PHP

Тема в разделе "Вопросы от блондинок", создана пользователем nAgi, 30 июн 2009.

  1. nAgi

    nAgi Активный пользователь

    С нами с:
    12 сен 2007
    Сообщения:
    43
    Симпатии:
    0
    Устал в ручную вычищать лишние теги получаемые при копировании текста из офисных документов. Искал решение нашел лишь ява скрипт для ИЕ

    Код (Text):
    1. <meta content="text/html; charset=utf-8" http-equiv="Content-Type"></meta><meta content="Word.Document" name="ProgId"></meta><meta content="Microsoft Word 11" name="Generator"></meta><meta content="Microsoft Word 11" name="Originator"></meta><link rel="File-List" href="file:///C:/DOCUME~1/gavrilin/LOCALS~1/Temp/msohtml1/01/clip_filelist.xml"></link><!--[if gte mso 9]><xml>

    Может у кого есть идеи по реализации фильтра на php?
    Чтобы вставил текст и забыл
     
  2. Volt(220)

    Volt(220) Активный пользователь

    С нами с:
    11 июн 2009
    Сообщения:
    1.640
    Симпатии:
    1
    Хе-хе... Мы около месяца писали на VBA перевод doc в html. =)
     
  3. Kreker

    Kreker Старожил

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0
    Одна из вещичек
    //Чистка от Ms Word
    $result = preg_replace(Array(
    '~&lt;\?xml:namespace prefix =(?:.*?)"&gt;~is',
    '~&lt;v:shapetype(?:.*?)&lt;\/v:shape&gt;~is',
    '~&lt;w:(?:.*?)&gt;(?:.*?)&lt;\/w:(?:.*?)&gt;~is',
    "~&lt;meta(?:.*?)&gt;~is",
    '~&lt;!\[(?:.*?)\]--&gt;~is',
    '~&lt;!--\[(?:.*?)\]&gt;~is',
    '~&lt;xml&gt;(?:.*?)&lt;\/xml&gt;~is',
    '~&lt;style&gt;(?:.*?)&lt;\/style&gt;~is',
    '~&lt;o:(?:.*?)&gt;&lt;/o:(?:.*?)&gt;~is',
    '~<link(?:.*?)>~is'),
    '', $result);
     
  4. nAgi

    nAgi Активный пользователь

    С нами с:
    12 сен 2007
    Сообщения:
    43
    Симпатии:
    0
    спасибо испробую отпишусь