За последние 24 часа нас посетил 22821 программист и 1271 робот. Сейчас ищут 748 программистов ...

Выдернуть данные из строк дампа .csv

Тема в разделе "Регулярные выражения", создана пользователем Денис_1985, 20 апр 2021.

  1. Денис_1985

    Денис_1985 Новичок

    С нами с:
    20 апр 2021
    Сообщения:
    1
    Симпатии:
    0
    Вопрос ерундовый, но сколько я не пытался понять регулярные выражения - не шарю в них и всё.
    Есть CSV файл, большой, поэтому с ним очень трудно работать, хочу разбить его строки на однотипные значения, чтобы создать БД и положить эти данные туда, тогда с ними станет возможно нормально работать.

    Пример одной строки:
    Первое значение;"Второе значение";"Третье значение, содержит в себе двоеточие:Один;Два;Три";"Четвертое значение, содержит <b class="bold">HTML теги</b>";;;;;;;

    Значения в каждой строке разделены точкой с запятой, но если разбить строку используя в качестве разделителя точку с запятой (;), то некоторые значения бьются, так как содержат эти символы в тексте.
    Некоторые значения, в частности содержащие точку с запятой, заключены в двойные кавычки, вот это я и хочу использовать для создания регуляпного выражения.

    Моя задача такова: нужно разбить строку на подстроки, разделённые точкой с запятой, где текст с этой точкой с запятой не заключен в двойные кавычки.

    Желаемый результат дробления строки должен быть такой:

    [0] => Первое значение
    [1] => "Второе значение"
    [2] => "Третье значение, содержит в себе двоеточие: Один;Два;Три"
    [3] => "Четвертое значение, содержит <b class="bold">HTML теги</b>"
    [4] =>
    [5] =>
    [6] => 42
    [7] =>
    ...

    Спасибо!
     
  2. roboformation

    roboformation Активный пользователь

    С нами с:
    30 авг 2020
    Сообщения:
    162
    Симпатии:
    40