Есть текст В нем несколько предложений Могут быть разделены .,!,? Но как быть если есть такое предложение "В г. Омск открыли музей им. А.С. Пушкина. Вход на выходные бесплатный." ? Как тут выбрать предложения точкой разделенные? Реально их только два, а точек 5
никак. если текст литературный, то можно пробовать играться с принятыми формами сокращений и надеяться на отсутствие фраз типа "в г. Омск есть г. И это г. я в рот е."
сделал небольшой анализ как выяснилось слова сокращения в основном 99% имеют не более 4 символом поэтому решил сделать так Код (Text): split("[a-zA-Zа-яА-Я0-9]{5,}\." все вроде боле-менее нормально, но съедает символы в последнем слове предложения "В г. Омск открыли музей им. А.С. Пуш" как сделать, чтобы не съедало?
Если только извращаться семантическими тегами обрамлять сокращения, х.з. где такое может критично понадобиться.