мощные инклуды

dark-demon · 27 июн 2007

проблематика:
1. требуется подгружать код по мере надобности,
2. код для подгрузки другого кода должен содержать всю необходимую информацию для точного определения расположения подгружаемого кода на диске. (в идеале - чтоб ещё и IDE могла подхватывать такие связи)
3. должна быть возможность образовывать пакеты с относительными связями между файлами. то есть при перемещении пакета или при создании его копии не должно быть необходимости править файлы внутри пакета. но, ссылки на другие пакеты должны быть относительно некоего общего корня (если, конечно, несколько пакетов не образуют более крупный пакет).

существующие решения:
a) include - подходит почти идеально, но есть проблема последействия (когда подгружаемый код после исполнения может оставлять произвольный мусор в пространстве имён вызывающего кода) и отсутствия кэширования интерпретированного кода (для решения этой проблемы приходится юзать APC и иже с ним).
б) require - то же самое, но в случае отсутствия файла пытается убить скрипт
в) eval+file_get_contents - принципиальное отсутствие кэширования интерпретированного кода и проблемы при отладке (невозможно отловить в каком файле хранится код вызвавший фатальную ошибку)
г) create_function+file_get_contents - то же самое, но производится кэширование интерпретированного кода на время выполнения скрипта.
д) __autoload - работает только с классами, при этом перенос пакета в другую директорию требует изменения всех определяемых внутри пакета классов, ибо в названии класса кодируется путь к нему.

решение: единственное более-менее вменяемое решение - это include. остальные лечению не поддаются. для выделения подгружаемому коду своего пространства имён оборачиваем вызов include в обычную функцию.
вот, что из этого получилось:

PHP:

<?php

function inc ($scriptPath) {

static $exeCounter= 0;

++$exeCounter;

$scriptArgs= func_get_args();

$scriptPath= realpath($scriptPath.'.inc');

$Path= dirname($scriptPath).'/';

ob_start();

$rets= include ($scriptPath);

$obs= ob_get_clean();

return ($obs==='') ? $rets : $obs;

}

?>

тут есть несколько простых условностей:
1. зарезервированная переменная $exeCounter - просто статистика, плюс в некоторых случаях этот счётчик оказывается весьма полезным.
2. зарезервированная переменная $scriptArgs - через неё подгружаемый код может получить передаваемые ему дополнительные параметры, задаваемые при вызове inc.
3. зарезервированныея переменные $scriptPath и $Path представляют из себя полные пути до подгружаемого скрипта и до директории в которой он расположен соответственно.
4. подгружаемый скрипт может возвращать данные. либо через echo (и иже с ним), либо через ключевое слово return
5. к передаваемому пути автоматически приписывается расширение .inc - это, конечно, спорный момент, но код от этого становится опрятней $-)

проиллюстрирую сказанное на примерах...

чтобы просто выполнить скрипт anyscript.inc в поддиректории libs нужно просто написать:

PHP:

<?php inc ('libs/anyscript'); ?>

скрипту можно передавать дополнительные параметры и получать возвращаемое значение:

PHP:

<?php echo inc ('dump',$var); ?>

этот код вызывает скрипт dump.inc, который является по сути php-темплейтом для дампа переменной. сам скрипт выводит данные как обычно в выходной поток, но благодаря буферизации функция inc вызвращает это дело в виде строки, которая уже с помощью echo выводится в браузер.

вызовы inc могут происходить рекурсивно из подгружаемых скриптов. для формирования пути относительно текущего скрипта можно использовать предопределённую переменную $Path:

PHP:

<?php inc($Path.'another/any_another_script'); ?>

под конец, приведу лаконичный скрипт, который возвращает исходный код вызывающего скрипта:

PHP:

<?php

$path= @$scriptPath[1];

if (!$path):

$trace= debug_backtrace();

$path= $trace[1]['file'];

endif;

readfile($path);

?>

теперь можно написать в любом скрипте:

PHP:

<?php echo 'исходный код текущего скрипта: <pre>'.inc('source').'</pre>'; ?>

и будет выведен исходный код текущего скрипта. в данном случае вторым параметром можно указать путь к какому-нибудь файлу и будет возвращён его исходный код (в итоге получается такой хитрый file_get_contents ;-))

как видим, решение удовлетворяет поставленным условиям: код подгружается только по необходимости, для подгрузки кода фактически передаётся чёткий путь, можно задавать путь как относительно текущего скрипта, так и относительно основного.

но не каждый код нужно выполнять каждый раз! например, скрипты, где определяются новые функции или классы повторно вызывать нельзя. да, можно применить для этих целей include_once, но гораздо интересней выглядит вариант с кэшированием:

PHP:

<?php

function onc ($scriptPath) {

static $exeCounter= 0;

static $scriptCache= array();

++$exeCounter;

$scriptArgs= func_get_args();

$scriptPath= realpath($scriptPath.'.onc');

$Path= dirname($scriptPath).'/';

$scriptCallHash= md5($scriptPath);

if (array_key_exists($scriptCallHash,$scriptCache)):

return $scriptCache[$scriptCallHash];

else:

ob_start();

$rets= include ($scriptPath);

$obs= ob_get_clean();

return $scriptCache[$scriptCallHash]= ($obs==='') ? $rets : $obs;

endif;

}

?>

при первом выполнении onc работает также как и inc, но результат работы (возвращаемое значение) запоминается и при следующем вызове этого скрипта с теми же параметрами значение берётся из кэша. это может оказаться полезным при многокртном вызове одного и того же темплейта с повторяющимися параметрами, но основное применение - определение классов и функций. например, мы можем использовать в пакете сколь угодно длинное название класса (к сожадению создать объект не создавая класс в пыхе нельзя, поэтому нужно создавать класс так, чтобы минимизировать вероятность коллизии имён), но остальные скрипты могут создавать объекты этого класса временно давая ему своё короткое имя. поясню, пусть у нас есть подгружаемый скрипт:

PHP:

<?php

class abrakadaba1999 {...};

return 'abracadabra1999';

?>

, теперь во внешнем скрипте можно написать так:

PHP:

<?php

$abrclass= onc('lib/abr');

$obj= new $abrclass($var1,$var2);

?>

вместо строки можно возвращать и свежесозданный объект этого класса, тогда сам объект попадёт в кэш и фактически будет реализовывать паттерн синглетон:

PHP:

<?php

class abrakadaba1999 {...};

return new abracadabra1999();

?>

к сожалению вот так написать нельзя:

PHP:

<?php

$class1= onc('lib/class1');

class class2 extends $class1 {};

return 'class2';

?>

но необходимость расширять классы из сторонних пакетов - не такая уж актуальная, так что с этим ограничением можно смириться. также настоятельно рекомендуется поднятие APC или чего-нибудь в этом духе, дабы зэнд не тратил лишнее время на интерпретацию скрипта в байт-код.
ещё один недостаток - ввиду отсутствия в php замыканий использование $Path внутри определения класса невозможно - его нужно заменять на dirname(__FILE__).'/'

уф... а теперь собственно вопрос. у меня тут сделано явное деление скриптов на одноразовые и многоразовые. расширения они имеют соответственно .onc и .inc, вызываются тоже разными функциями - onc() и inc(). я вот никак не могу определиться, хорошо это или плохо а вы как думаете? если конкретней, то имеет ли практическую ценность возможность в зависимости от ситуации один и тот же скрипт вызывать либо inc-ом, либо onc-ом?

ps: последнюю версию этих двух функций можно наблюдать тут: http://mojura.googlecode.com/svn/trunk/_engine.onc

Anonymous · 27 июн 2007

dark-demon, многа букаф =)))

dark-demon сказал(а):

у меня тут сделано явное деление скриптов на одноразовые и многоразовые. расширения они имеют соответственно .onc и .inc, вызываются тоже разными функциями - onc() и inc(). я вот никак не могу определиться, хорошо это или плохо а вы как думаете? если конкретней, то имеет ли практическую ценность возможность в зависимости от ситуации один и тот же скрипт вызывать либо inc-ом, либо onc-ом?
Нажмите, чтобы раскрыть...

Имхо, сугубо имхо, — любые ограничения уже не есть хорошо. Возможность вызывать по-разному, хорошо, ограничение... не очень.

dark-demon · 27 июн 2007

ну, это также как "возможность шагнуть в пропость - хорошо, но перила не помешают"

armadillo · 1 авг 2007

вот такой вопрос.
модули распиханы по своим папкам в папке modules
изначально инклудится только .h.php файлы где связываются внешние и внутренние имена функций
выглядят они как 20 строчек.
$modules[$name]=$func;

время выполнения 20 таких инклудов, каждый в своей папке - пусть и на дурном селероне с дурным диском - 0.2-0.3 сек.
Много. Почему?

Dagdamor · 1 авг 2007

armadillo
Ну кажется ответ лежит на поверхности - убери все содержимое из этих .h.php файлов, пусть будут пустые, и если скрипт по-прежнему будет работать долго - причина одна, если начнет работать быстро - виноват сомнительный код...

dark-demon · 1 авг 2007

изначально инклудится только .h.php файлы где связываются внешние и внутренние имена функций
Нажмите, чтобы раскрыть...

по списку или по результатам поиска на диске?

выглядят они как 20 строчек.
$modules[$name]=$func;
Нажмите, чтобы раскрыть...

"кручу, верчу, запутать хочу"?

в целом же, если планируется много инклудов - нужно ставить APC либо его аналоги.

мощные инклуды

dark-demon Активный пользователь

Anonymous Guest

dark-demon Активный пользователь

armadillo Активный пользователь

Dagdamor Активный пользователь

dark-demon Активный пользователь

Быстрый поиск

мощные инклуды

dark-demon Активный пользователь

Anonymous Guest

dark-demon Активный пользователь

armadillo Активный пользователь

Dagdamor Активный пользователь

dark-demon Активный пользователь