Поиск в локальной папке

zarapyan · 16 апр 2010

Ума не приложу как это сделать, существует локальная папка в которой содержится архив pdf-файлов (~4Гб), эта папка прикручена к сайту с помощью файл-менеджера. требуется сделать поиск(по этой папке) на сайте с возможностью отображения или скачивания информации от туда. Пробовал разные скрипты (Risearch, Rusearch, etc.) ниасилил не один.

Mr.M.I.T. · 16 апр 2010

glob() or scandir()
+ file_get_contents
+ stripos() or preg_match

but only for text files

zarapyan · 16 апр 2010

Mr.M.I.T. сказал(а):

glob() or scandir()
+ file_get_contents
+ stripos() or preg_match

but only for text files
Нажмите, чтобы раскрыть...

благодарю, за ответ. Но можно поподробнее объяснить (честно говоря только осваиваю язык и программирование в целом)

akrinel · 16 апр 2010

Mr.M.I.T., сколько интересно пользователей осилит сервер если scandir+file_get_contents юзать для поиска?

zarapyan, мне лично поиск в 4-х гигабайтах pdf файлов посредством PHP представляется не вполне логичным.
Я бы сделал как-то так:

1. Прочел PDF.
2. Создал табличку в БД.
А-ля: id файла | название файла | путь к файлу | содержимое.
3. Поставил Sphinx
4. Проиндексировал содержимое нашей таблички
5. Ну и в результате получил более-менее быстрый поиск.

P.S. Если не любите читать по английски или "много букаф":
У глубоко уважаемого товарища adw0rd был цикл статей на тему Sphinx.

Mr.M.I.T. · 16 апр 2010

akrinel
если делать не через жопу, то сотни тысяч

akrinel · 17 апр 2010

Mr.M.I.T., 4Gb?... Словосочетания?.... Слова в разных формах?....
Короче покажи свое решение, любопытно взглянуть.

Simpliest · 17 апр 2010

не покажет.

lexa · 17 апр 2010

akrinel, 1. словарь получится максимум метров 50 - в худшем случае (это я примерно ляпнул, очень-очень сомневаюсь, что перевалит хотя бы за 30). 2. никто же не говорил и не спрашивал об алгоритме поиска.

Знай только потребление памяти оптимизируй: режь словари на подгруппы, жги книги, бей баб.

В советские времена обходились без всяких там "Сфинксов".

akrinel · 17 апр 2010

lexa, да я понимаю что без всего можно обойтись и все работать будет мега круто и там будет только "Собственный теплый ламповый код"™. Можно даже и без кода обойтись, нанять 100 000 человек и заставить выучить каждого по чуть чуть информации из архива... Вот только нахрена?

Padaboo · 17 апр 2010

akrinel
с другом сегодня обсуждали устройство поисковой машины гугла
пришли к выводу что там сидит 1ккк китайцев у каждого открыт вордовский документ со словами и относящимися к ним сайтам) по команде через icq они начинаю бешено искать, скидывают результаты в статичные html файлы которые потом отдаются пользователю ))

lexa · 18 апр 2010

akrinel, because we can.

[vs] · 18 апр 2010

0)Составляешь список документов
1)Составляешь список слов в документах
2)Сопостовляешь каждому слову подходящие документы

zarapyan · 23 апр 2010

Эээ.... это все очень и хорошо и всем огромное спасибо за ответы, но чтение самого PDF мне не требуется, т.к. это в основном изображения со скана, нужно чтобы поиск велся по названиям файлов.

[vs] · 23 апр 2010

http://php.net/glob

zarapyan · 23 апр 2010

А можно немного поподробнее?

[vs] · 23 апр 2010

PHP:

<?php

print_r(glob('./dir/a*.pdf'));

PHP:

<?php

print_r(glob('./dir/b*.pdf'));

zarapyan · 23 апр 2010

Извини, я повторюсь - я немного слабоват в программировании, алгоритм кода мне непонятен.

PHP:

# <?php

# print_r(glob('./dir/a*.pdf'));

zarapyan · 29 апр 2010

Благодарю за ответы! Я нашел другое решение ! Тему можно закрыть!

Поиск в локальной папке

zarapyan Активный пользователь

Mr.M.I.T. Старожил

zarapyan Активный пользователь

akrinel Активный пользователь

Mr.M.I.T. Старожил

akrinel Активный пользователь

Simpliest Активный пользователь

lexa Активный пользователь

akrinel Активный пользователь

Padaboo Старожил
Команда форума Модератор

lexa Активный пользователь

[vs] Суперстар
Команда форума Модератор

zarapyan Активный пользователь

[vs] Суперстар
Команда форума Модератор

zarapyan Активный пользователь

[vs] Суперстар
Команда форума Модератор

zarapyan Активный пользователь

zarapyan Активный пользователь

Быстрый поиск

Поиск в локальной папке

zarapyan Активный пользователь

Mr.M.I.T. Старожил

zarapyan Активный пользователь

akrinel Активный пользователь

Mr.M.I.T. Старожил

akrinel Активный пользователь

Simpliest Активный пользователь

lexa Активный пользователь

akrinel Активный пользователь

Padaboo Старожил Команда форума Модератор

lexa Активный пользователь

[vs] Суперстар Команда форума Модератор

zarapyan Активный пользователь

[vs] Суперстар Команда форума Модератор

zarapyan Активный пользователь

[vs] Суперстар Команда форума Модератор

zarapyan Активный пользователь

zarapyan Активный пользователь

Padaboo Старожил
Команда форума Модератор

[vs] Суперстар
Команда форума Модератор

[vs] Суперстар
Команда форума Модератор

[vs] Суперстар
Команда форума Модератор