За последние 24 часа нас посетили 18095 программистов и 1624 робота. Сейчас ищут 1294 программиста ...

Выбрать все предложения в тексте

Тема в разделе "Регулярные выражения", создана пользователем inline, 13 ноя 2012.

  1. inline

    inline Активный пользователь

    С нами с:
    21 май 2010
    Сообщения:
    466
    Симпатии:
    0
    Есть текст
    В нем несколько предложений
    Могут быть разделены .,!,?
    Но как быть если есть такое предложение "В г. Омск открыли музей им. А.С. Пушкина. Вход на выходные бесплатный." ?
    Как тут выбрать предложения точкой разделенные? Реально их только два, а точек 5
     
  2. [vs]

    [vs] Суперстар
    Команда форума Модератор

    С нами с:
    27 сен 2007
    Сообщения:
    10.559
    Симпатии:
    632
    Никак.
     
  3. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    никак.
    если текст литературный, то можно пробовать играться с принятыми формами сокращений и надеяться на отсутствие фраз типа "в г. Омск есть г. И это г. я в рот е."
     
  4. inline

    inline Активный пользователь

    С нами с:
    21 май 2010
    Сообщения:
    466
    Симпатии:
    0
    сделал небольшой анализ
    как выяснилось слова сокращения в основном 99% имеют не более 4 символом
    поэтому решил сделать так
    Код (Text):
    1. split("[a-zA-Zа-яА-Я0-9]{5,}\."
    все вроде боле-менее нормально, но съедает символы в последнем слове предложения
    "В г. Омск открыли музей им. А.С. Пуш"
    как сделать, чтобы не съедало?
     
  5. link00

    link00 Активный пользователь

    С нами с:
    1 сен 2012
    Сообщения:
    65
    Симпатии:
    0
    Если только извращаться семантическими тегами обрамлять сокращения, х.з. где такое может критично понадобиться.