Нейросеть, которая обучается во сне

Maputo · 23 мар 2018

@abrdabr, но у меня немного другой тип сети. Я как раз предполагаю, что к структуре она должна быть менее чувствительна. Да, первые результаты после внесения корректировок будут другие, но потом сеть должна занять новое устойчивое положение.

abrdabr сказал(а): ↑

мне удалось выработать несколько правил, формул оптимизирующих структуру
Нажмите, чтобы раскрыть...

А можно подробнее?

Maputo · 23 мар 2018

@abrdabr, я просто начал подумывать о такой структуре:

Но тут получается 6 скрытых слоев. В каждом слое по 64 нейрона - всего 512 (~5000 синапсов). Но сколько такая сеть будет обучаться - вопрос. Потому как обучение происходит от входа к выходу. Сначала первый скрытый слой обучится, потом 2й и т.д.

abrdabr · 23 мар 2018

Ну оч много не скажу, то что помню, могу ошибаться, потом мб покапаюсь в записях, но наврятли.
1) экспериментально удалось установить что нейросеть с одним скрытым слоем, вне зависимости от количества входных-выходных нейронов имеющая в среднем слое определённое число нейронов показывает лучшие результаты, чем таже сетка с большим числом нейронов. это количество было либо 8? либо 40 либо 96или128, ну то что 40 было это точно. (см. описание выше про +1 нейрон)
2) далее я приступил к определению оптимального количества слоёв при условии что количество нейронов в каждом слое одинаково, прямой связи не обнаружил, сеть приспасабливалась и результаты были примерно одинаковы
3) Попытался определить оптимальную форму нейросети типа 10-100-50-25-10 или 10-40-95-40-10 т.е. при одинаковом числе нейронов, зависимость была, пытался создать формулу, дальше экспериментов дело не зашло
4) и тут я подумал, есть же нейросеть пусть она определяет за меня оптимальную архитектуру нейросети, но моя криворукость не позволила идее развится
5) затем я подал на входные нейроны не математические данные, а логические, что привело все предыдущие результаты почти в полную непригодность,- некоторые предположения оказались ложными, некоторые не столь впечатляющими. К примеру п1 при логических дынных давал не 0.99 а всего 0.6. и тут я забил на всё это так как я не расчитывал так облажатся с типом входных данных...

p.s. оптимальное число эпох было равно вроде числу нейронов умноженому на два

Maputo сказал(а): ↑

Но сколько такая сеть будет обучаться
Нажмите, чтобы раскрыть...

долго, но не обязательно же её обучать методом рандома, можно обучить на примере прошлой нейросети.

igordata · 23 мар 2018

про младенца - не верю

abrdabr · 23 мар 2018

@igordata хз на ютубе видос видел, вроде как профессор какой-то выступал

Maputo · 23 мар 2018

abrdabr сказал(а): ↑

это количество было либо 8? либо 40 либо 96или128, ну то что 40 было это точно.
Нажмите, чтобы раскрыть...

Вообще странно, что такая четкая привязка к конкретному количеству, несмотря на количество входных нейронов. Это может быть связано с дискретностью данных либо особенностями алгоритмов обучения.

abrdabr сказал(а): ↑

Попытался определить оптимальную форму нейросети типа 10-100-50-25-10 или 10-40-95-40-10 т.е. при одинаковом числе нейронов, зависимость была, пытался создать формулу, дальше экспериментов дело не зашло
Нажмите, чтобы раскрыть...

Ну это мне еще предстоит сделать. Потому как большое количество слоев (по моим расчетам) должно давать эффект "эхо" или "резонанс" в более удаленных слоях от входа. И это зависит от пропускной способности (количества нейронов) каждого слоя.

abrdabr сказал(а): ↑

и тут я подумал, есть же нейросеть пусть она определяет за меня оптимальную архитектуру нейросети, но моя криворукость не позволила идее развится
Нажмите, чтобы раскрыть...

По сути я разделил процесс обучения на кратковременную и долговременную память. Некоторые веса синапсов со временем стремятся к 0 - это говорит о том, что данная связь может и не нужна нейрону. Общая картина весов (та что на графиках) - это длоговременная память. А мелкие изменения - кратковременная. В какой-то момент общие изменения должны прекратиться и будет работать только кратковременная память. После сна в 50000 итераций нейрон, отслеживающий все игровое поле практически не изменился.

abrdabr сказал(а): ↑

долго, но не обязательно же её обучать методом рандома, можно обучить на примере прошлой нейросети.
Нажмите, чтобы раскрыть...

Так и будет. К тому же эта версия с каждым разом делает игру напряженнее.

Maputo · 23 мар 2018

abrdabr сказал(а): ↑

3) Попытался определить оптимальную форму нейросети типа 10-100-50-25-10 или 10-40-95-40-10 т.е. при одинаковом числе нейронов, зависимость была, пытался создать формулу, дальше экспериментов дело не зашло
4) и тут я подумал, есть же нейросеть пусть она определяет за меня оптимальную архитектуру
Нажмите, чтобы раскрыть...

Чисто математически архитектуру (по количеству нейронов в слоях) можно было бы разделить на три элементарных типа (например, "линейный", "обобщающий" и "избыточный"). В линейном типе количество нейронов в каждом слое одинаковое и количество возможных состояний слоя тоже. В обобщающих сетях количество нейронов с каждым слоем уменьшается и уменьшается количество состояний каждого слоя - поэтому в них и процесс обучения идет быстрее. Избыточные - постоянное увеличение количества нейронов в каждом последующем слое, за счет чего для полного обучения выходного слоя недостаточно "бесконечного" количества состояний входного слоя. И выходной слой никогда не обучится.

Мне бы хотелось получить нечто подобное 4 архитектуре. Образующийся буфер никогда не обучится и нейроны входящие в состав буферных слоев весьма подвижны. В данном месте сети можно было бы хранить целые понятия. Некое сходство с ассоциативным мышлением.
А "эхо" или "резонанс" - это волны, которые я нарисовал в первом типе и они же помогают обучать нейроны выходного слоя в 4м типе.

Fell-x27 · 23 мар 2018

Maputo сказал(а): ↑

Но она так же обладает и памятью.
Нажмите, чтобы раскрыть...

Long-term? С вентилями/гейтами и клеточными состояниями, или простейшей кратковременной затухающей?

Maputo сказал(а): ↑

Это тот же нейрон выходного слоя на ячейке 56 после 50000 итераций "сна". Разница между весами усилилась. Но в игре себя такая сеть показала ужасно.
Нажмите, чтобы раскрыть...

У нейросетей есть такая штука как "переобучение". Грубо говоря, за кучу эпох можно идеально натаскать нейросеть на идеальную аппроксимацию входных данных и идеальное, чуть ли не нулевое схождение. Но, в итоге, окажется, что нейросеть становится дебилом, теряя способность к абстракции и не способна выдать ничего вменяемого на неизвестных ранее входных данных. Как старшеклассник, которого научили сдавать ЕГЭ по математике, вместо того, чтобы научить математике.

abrdabr сказал(а): ↑

я тоже когда начинал то думал чем больше эпох и нейронов, тем умнее будет сетка, но оказалось всё не так просто...
Нажмите, чтобы раскрыть...

У сеток тоже бывает горе от ума. Избыток нейронов вызывает повышение количества шума в итоговом сигнале.

abrdabr сказал(а): ↑

К примеру возьмём сетку(фанн) 1-40-2 которая определяет подано ли положительное-отрицательное число
Нажмите, чтобы раскрыть...

Для данной задачи достаточно 1-6-1, просто за глаза.
У меня на тестах, в свое время, сеточка 1-6-1 на выборке из всего 20+ сетов обучалась определять, больше ли один аргумент второго. В обучающей выборке были только целые положительные числа. В итоге, 1-6-1, и такой малой выборки ей хватило, чтобы работать с отрицательными числами и дробями, которые она отродясь не видела. А на деле, если сверхзапредельные точности не нужны, хватает даже 3 нейронов в скрытом слое. А на 1-2-1 легко поднимается XOR, хоть его и рекомендуют делать с тремя нейронами.

Пы.Сы фанн веселый, но на нем далеко не уедешь. Рекуррентку на нем строить - тот еще головняк. На keras надо уходить питоновый, вот где правда.

Maputo · 23 мар 2018

Fell-x27 сказал(а): ↑

Long-term? С вентилями/гейтами и клеточными состояниями, или простейшей кратковременной затухающей?
Нажмите, чтобы раскрыть...

Во время сна стерлась именно кратковременная (простейшая), а долговременная - закрепилась. Но в ней не было умения хорошо играть в реверси.

Maputo · 25 мар 2018

Для более детального разбора состояния сети и в попытке форсировать обучение проведено около 20-ти турниров между последними версиями сети. В одном турнире участвовало в среднем 12 сетей. Сети выигрывающие в первом туре и снимки сетей победителей второго тура и выше переходили в следующий турнир. При этом я менял настройки "сна" между турами турнира.
С помощью сна удалось расшатать веса, но каких либо серьезных сдвигов в их относительном изменении в выходном слое не обнаружено. Из-за чего я могу сделать вывод, что сеть в данном режиме достигла своего устойчивого состояния. Но играть так и не научилась.

Графики изменения весов нейронов нескольких победителей турниров.

Нейрон на диагонали 7-56 (скрытый слой)

Нейрон на ячейке 56 (выходной слой)

Остальные нейроны вели себя похожим образом. В скрытом слое наблюдались весьма заметные относительные изменения весов, а в выходном слое (в зависимости от настроек "сна") веса равномерно поднимались и опускались.

Осталось последнее в эксперименте с этой структурой - выключить режим фрагментарной работы сети и проверить как себя сеть поведет в том режиме, в котором и должна работать.

Maputo · 25 мар 2018

Первые снимки сети после переключения режима работы сети с фрагментарного на полный.
Нейрон диагонали 7-56:

Нейрон на ячейке 56

Первые две полоски (красная и оранжевая) - веса последних сетей, эволюционировавших при фрагментарном режиме работы сети.
Вторые две полоски (желтая и салатовая) - веса их потомков после переключения режима работы сети на полный (эволюционировали после 30 и 60 игр).

Почти на всех нейронах наблюдается равномерное падение весов, за редким исключением. Например, у нейрона скрытого слоя, отслеживающего сегмент 5х5 с центром в ячейке 28 общий рост весов:

Видимо это остаточные сдвиги после снов в турнирах.

С этих двух сетей будет получено новое поколение, работающее в другом режиме.

Maputo · 27 мар 2018

При попытке использовать сеть с 6-ю скрытыми слоями использовал режим самообучения. Т.е. без моего участия - все в турнирах. За целый день прокачать удалось до третьего слоя. Но весьма полезный опыт получил при наблюдении за развитием сети.

Процесс изменения весов нейронов (по 4 синапса), стоящих друг за другом в разных слоях

1й скрытый слой:

2й скрытый слой:

3й скрытый слой:

4й скрытый слой:

5й скрытый слой:

6й скрытый слой:

выходной слой:

При этом на выходе до сих пор значения близкие к нулю. А так же пугает инертность такой структуры.

abrdabr · 27 мар 2018

@Maputo как ты графики получаешь?

Maputo · 27 мар 2018

@abrdabr, с помощью обычных GD функций рисую линии и пишу текст.
Типа таких

PHP:

...

public function set_block_line($x, $y, $color = 'red', $weight = 1, $delta = 0)

{

$pos = $this->position($x, $y);

$p0 = $this->position(0, 0)['y'] - 1;

$w = $weight * $this->scale_x * 0.96;

$cx = $pos['x'] - $this->scale_x * 0.5 + $w * ($delta + 0.5) + 1;

$this->line($cx, $p0, $cx, $pos['y'], $color, $w);

}

...

private function line($x1, $y1, $x2, $y2, $color = 'black', $width = 1)

{

imagesetthickness($this->img, ceil($width));

imageline($this->img, (int)$x1, (int)$y1, (int)$x2, (int)$y2, $this->colors[$color]);

imagesetthickness($this->img, 1);

}

...

abrdabr · 27 мар 2018

@Maputo ах тыж, я думал какойнить специальный софт есть. я то обычно текстовые данные читал...

denis01 · 27 мар 2018

@abrdabr посмотри https://d3js.org/

Maputo · 4 апр 2018

igordata сказал(а): ↑

про младенца - не верю
Нажмите, чтобы раскрыть...

abrdabr сказал(а): ↑

@igordata хз на ютубе видос видел, вроде как профессор какой-то выступал
Нажмите, чтобы раскрыть...

Профессор или нет, но нейробиолог (5 мин 23 сек)

тут несколько иначе описывается процесс. До двух лет хаотичный рост связей, а потом их уменьшение.

Васяня · 6 апр 2018

Я один не понял как играть?

Maputo · 6 апр 2018

@Васяня вот тут правила
Пока у нейросети успехов нет. Пытаюсь переосмыслить структуру.

Нейросеть, которая обучается во сне

Maputo Активный пользователь

Maputo Активный пользователь

abrdabr Новичок

igordata Суперстар
Команда форума Модератор

abrdabr Новичок

Maputo Активный пользователь

Maputo Активный пользователь

Fell-x27 Суперстар
Команда форума Модератор

Maputo Активный пользователь

Maputo Активный пользователь

Maputo Активный пользователь

Maputo Активный пользователь

abrdabr Новичок

Maputo Активный пользователь

abrdabr Новичок

denis01 Суперстар
Команда форума Модератор

Maputo Активный пользователь

Васяня Активный пользователь

Maputo Активный пользователь

Быстрый поиск

Нейросеть, которая обучается во сне

Maputo Активный пользователь

Maputo Активный пользователь

abrdabr Новичок

igordata Суперстар Команда форума Модератор

abrdabr Новичок

Maputo Активный пользователь

Maputo Активный пользователь

Fell-x27 Суперстар Команда форума Модератор

Maputo Активный пользователь

Maputo Активный пользователь

Maputo Активный пользователь

Maputo Активный пользователь

abrdabr Новичок

Maputo Активный пользователь

abrdabr Новичок

denis01 Суперстар Команда форума Модератор

Maputo Активный пользователь

Васяня Активный пользователь

Maputo Активный пользователь

igordata Суперстар
Команда форума Модератор

Fell-x27 Суперстар
Команда форума Модератор

denis01 Суперстар
Команда форума Модератор