чтение больших xlsx

ArtemMinsk · 17 июн 2019

Доброго времени суток!
Столкнулся с необходимостью загрузить в mySQL большой xlsx (более 300 000 строк). Для загрузки меньших файлов использовал PHPExcel. Но при загрузке большого файла сервер падает по памяти. Может кто сталкивался с такого рода проблемой и как то нашел решение?
P.S. увеличить размер физической памяти возможности нет(((

yanuzay · 17 июн 2019

ArtemMinsk сказал(а): ↑

Доброго времени суток!
Столкнулся с необходимостью загрузить в mySQL большой xlsx (более 300 000 строк). Для загрузки меньших файлов использовал PHPExcel. Но при загрузке большого файла сервер падает по памяти. Может кто сталкивался с такого рода проблемой и как то нашел решение?
P.S. увеличить размер физической памяти возможности нет(((
Нажмите, чтобы раскрыть...

сохраняй excel файлы, как csv.
CSV это текстовый файл, разделитель колонок символ ";" либо "," , который открывается excel и отображается как excel файл.

Обработка csv меньше ресурсов расходует.

ArtemMinsk · 18 июн 2019

а есть ли способ преобразовать xlsx в csv программно?

romach · 18 июн 2019

https://github.com/box/spout - в большинстве случаев использования этого пакета будет достаточно. Скорость обработки несколько меньше, скорее всего придется переписать обработчик, т.к. файл читается не разом, а построчно, но по оперативке вы легко уложитесь 3-5мб на файле любого размера.

Если скорость также критична, то лучше действительно конвертировать в csv, а затем разбирать его через fgetcsv, потому что на большом количестве итераций разница между while(fgetcsv) и вызовами методов / функций всё же заметна.
На vps самый оптимальный вариант - поставить Libreoffice и потом с консоли делать примерно вот так:

Код (Text):

libreoffice --headless --convert-to csv book.xlsx --outdir conv/

, ну и есть ещё питоновский xlsx2csv как запасной вариант.

ArtemMinsk · 18 июн 2019

огромное спасибо!

yanuzay · 18 июн 2019

ArtemMinsk сказал(а): ↑

а есть ли способ преобразовать xlsx в csv программно?
Нажмите, чтобы раскрыть...

да Господи, программа называется Microsoft Office Excel , нажимаешь Сохранить как , там не только что в csv можно сохранить, даже в pdf можно сохранить

ArtemMinsk · 19 июн 2019

программно имеется в виду не производя никаких манипуляций у себя на компе))
пришел имэйл с файлом -> скрипт скачал файл -> преобразовал в csv -> залил в mySQL

ElisDN · 24 июн 2019

Грузить частями с помощью ChunkReaderFilter https://github.com/cystbear/PHPExcel/blob/master/Documentation/Examples/Reader/exampleReader11.php

[vs] · 29 июн 2019

xlsx это zip-архив с xml-файлами внутри. Его можно распаковать как обычный архив и распарсить xml хоть построчно. Конвертация в csv конечно лучший вариант, если структура позволяет

Dron-Boy · 23 авг 2019

[vs] сказал(а): ↑

xlsx это zip-архив с xml-файлами внутри. Его можно распаковать как обычный архив и распарсить xml хоть построчно. Конвертация в csv конечно лучший вариант, если структура позволяет
Нажмите, чтобы раскрыть...

О точно, а то помню что была задача похожая. Я распаковывал его как архив. Тоисть сначала пересохранял как zip потом распаковывал и обрабатывал файлы.

mike4ip · 24 авг 2019

Конвертация в CSV - лучший выход, как подсказали выше. От себя добавлю, что если и CSV будет слишком жирный - его без проблем можно разбить на несколько файлов, т.к. там внутри уже не архив, а обычные строки.

DarkU · 7 сен 2019

1. Перейти на CSV (открывается также програмой excel без проблем).
2. CSV проще работать с ним и получать нужные данные по нужным ячейкам).
3. 300к это даже не много. Если у вас сервер не может запихнуть в буфер эти 300к и при это вы не можете запросить сервер "по лучше", тогда (или вообще всегда) используйте генератор. Сам лично обрабатывал в цикле при 128мб лимиту памяти данные которые > 100млн. записям.

чтение больших xlsx

ArtemMinsk Новичок

yanuzay Активный пользователь

ArtemMinsk Новичок

romach Старожил

ArtemMinsk Новичок

yanuzay Активный пользователь

ArtemMinsk Новичок

ElisDN Активный пользователь

[vs] Суперстар
Команда форума Модератор

Dron-Boy Старожил

mike4ip Новичок

DarkU Активный пользователь

Быстрый поиск

чтение больших xlsx

ArtemMinsk Новичок

yanuzay Активный пользователь

ArtemMinsk Новичок

romach Старожил

ArtemMinsk Новичок

yanuzay Активный пользователь

ArtemMinsk Новичок

ElisDN Активный пользователь

[vs] Суперстар Команда форума Модератор

Dron-Boy Старожил

mike4ip Новичок

DarkU Активный пользователь

[vs] Суперстар
Команда форума Модератор