За последние 24 часа нас посетили 17475 программистов и 1712 роботов. Сейчас ищут 1709 программистов ...

Парсим ФИАС

Тема в разделе "Прочее", создана пользователем Mat, 5 май 2012.

  1. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0
    Всем привет! на примере XML Фиаса.
    Там есть XSD и XML 800мб, как это всё парсить быстро? Поделитесь опытом, пожалуйста.
     
  2. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0
  3. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0
  4. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0
    Вобще после всех исследований вывод один, DBF -> *SQL... однако, XML базы данных весьма интересная вещь и вероятнее в ближайшем будущем, все на них и перейдут.
     
  5. Апельсин

    Апельсин Активный пользователь

    С нами с:
    20 мар 2010
    Сообщения:
    3.645
    Симпатии:
    2
    Mat
    Ты не из Челябинска случайно? А то завести свой личный блог в форуме пхп.ру мог бы только суровый мужик)
     
  6. iliavlad

    iliavlad Активный пользователь

    С нами с:
    24 янв 2009
    Сообщения:
    1.689
    Симпатии:
    4
    Наверное не перейдут. Сложности в парсинге XML в 800 Мбайт тому подтверждение.
     
  7. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    MXL-базы это вынужденный аппарат древних =) и никому не нужен в здравом уме даже чтобы конфиги хранить. Он был рожден в моде на теги и безумен по своей природе. Его смерть станет отрадой для всех, кто хоть раз связывался с этим форматом. Единственное приложение, использующее этот ваш XML, это джаббер, за что он получает кучу критики, т.к. постоянно порождает тонны паразитарного трафика.

    XML дитя бюрократов и устарел уже при рождении. Хотя он активно форсился в массы, никаких активных позиций он не занял.

    Единственное преимущество XML - его распространенность и кроссплатформенность. Преимущество перед кем? А не перед кем. Нет больше никаких других подобных форматов, потому что единственная толковая задача, которая на него возлагается - это экспорт/импорт.
     
  8. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0
    http://www.youtube.com/watch?feature=player_embedded&v=58feWHkxfLo аппарат древних?

    Добавлено спустя 5 минут 49 секунд:
    XML database server всё разруливает и 800 и больше -> потоковый парсинг, проблема что нет коннекторов для PHP или они не доведены до ума(типа SDO) или я их ещё не нашёл, однако в Perlе есть поддержка этих технологий.

    ps: ну это так... размышления на тему.... а вобще я за SQL =)

    Добавлено спустя 7 минут 8 секунд:
    Это надо сказать тому кто Фиас в XML сделал... и не рассказал почему!)

    Добавлено спустя 27 минут 39 секунд:
    ps:
    http://russia.emc.com/collateral/software/white-papers/h466 ... nce-wp.pdf
     
  9. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    а если я на ютубе своё рисование на доске выложу, то тоже смогу убедить всех неверующих? =)

    я помню когда появился xml и зачем. и это произошло не от хорошей жизни.

    единственное зачем он нужен - вывалить аппаратно-читаемые данные так, чтобы они прочитались в любой другой системе.
    XML подобен письму в бутылке или наскальным надписям. Пантомима тоже понятна всем и каждому. Назвать это эффективным у здравомыслящего человека язык не повернется.

    Всё что я говорю, не умаляет единственного достоинства XML, которым он обладает. А что такое базы на xml... вы не первый наверное =) и до вас плавали и плевались потом. Всё зависит от соотношения требований и возможностей.
     
  10. Mat

    Mat Активный пользователь

    С нами с:
    12 дек 2006
    Сообщения:
    391
    Симпатии:
    0