Массив данных в ОЗУ

sx000 · 10 сен 2010

Требуется загрузить файл с данными в массив и хранить его в озу, причина более 1млн строк в файле, задача работа с этими данными - поиск даблов при загрузке новых строк.
Помогите как это делаеться не могу сообразить не как. Может есть какие то более гуманные способы работы с большим объемом строчных данных, важна скорость обработки и чтоб срвак не нагружало сильно.

[vs] · 10 сен 2010

А чо, даблов не должно быть?
Используй MySQL, используй уникальные поля.

sx000 · 10 сен 2010

Да даблов не должно быть плюс надо делать на против строк пометки небольшие. Ну велосипед по сути тот же MYSQL.
Но я не умею работать с ней на достаточно грамотном уровне, чтобы не нагружать сам MYSQL тупыми запросами, ну пока так ... вот решил что оптимально будет работать с файловым массивом загруженным в озу, тк обращений будет в секунду несколько десятков, а если учесть что даблы искать да и выборки делать с пометками это будет просто кирдык.

Gromo · 10 сен 2010

оптимально - MySQL.
грузить в память млн строк при каждом обращении - сервер сдохнет
уже при нескольких запросах в секунду. просто памяти не хватит

Ensiferum · 10 сен 2010

- увеличивай выделяемую память через ini_set("memory_limit","128M");
- оптимизируй код как только это возможно

voxel · 11 сен 2010

Храните данные в кеше. Оптимально - memcache. Другие варианты - berkley db, файловый кеш. Ключ для кеша - md5(строки) например. И дублирующихся строк не будет, и MySQL разгрузите.

Kreker · 11 сен 2010

Делайте так:
Mysql -> загрузка из файла в таблицу -> insert into tbl2 from (select distict.row from tbl1) as t1

Gromo · 11 сен 2010

voxel сказал(а):

Ключ для кеша - md5(строки)
Нажмите, чтобы раскрыть...

+1
самое оно

igordata · 11 сен 2010

sx000
проще работы с мускулом думаешь выйдет? =)) хреначо. учи мускул, там осваивать минут десять, а дублированные строки он ищет на ура - у него индексы есть!

vasa_c · 11 сен 2010

sx000 сказал(а):

Но я не умею работать с ней на достаточно грамотном уровне, чтобы не нагружать сам MYSQL тупыми запросами, ну пока так .
Нажмите, чтобы раскрыть...

Если вместо того, чтобы тратить время на занятие подобной фигнёй, потратить его на изучение основ MySQL, это будет гораздо полезнее, как для данной задачи, так и для последующих.

Массив данных в ОЗУ

sx000 Активный пользователь

[vs] Суперстар
Команда форума Модератор

sx000 Активный пользователь

Gromo Активный пользователь

Ensiferum Активный пользователь

voxel Активный пользователь

Kreker Старожил

Gromo Активный пользователь

igordata Суперстар
Команда форума Модератор

vasa_c Активный пользователь

Быстрый поиск

Массив данных в ОЗУ

sx000 Активный пользователь

[vs] Суперстар Команда форума Модератор

sx000 Активный пользователь

Gromo Активный пользователь

Ensiferum Активный пользователь

voxel Активный пользователь

Kreker Старожил

Gromo Активный пользователь

igordata Суперстар Команда форума Модератор

vasa_c Активный пользователь

[vs] Суперстар
Команда форума Модератор

igordata Суперстар
Команда форума Модератор