Имена участников (разделяйте запятой).
За счет последних новшеств удалось трехдневный процесс обучения уложить в один день. Веса распределились похожим образом, но разница все же есть....
Из-за обнаруженного "бага" состояние сети пришлось откатить на 3 дня назад, для сохранения чистоты эксперимента. Тактический прием с захватом...
Решил доверить этот процесс не человеку, а компьютеру. Теперь после каждой игры с человеком нейросеть "переосмысляет" свои ходы. Т.е.: если она...
@Abyss, я думаю "беседы" самое то. Нашел способ коррекции "ошибок". Если при определенной комбинации фишек на игровом поле "дергать" тот выходной...
Турниры показали, что сеть после сна слабее. И те кто у них выигрывает получают мало опыта, в следствии чего тоже проигрывают. Можно посмотреть по...
@Fell-x27, хорошо бы еслиб в моем случае оказалось так же. Но 100% уверенности у меня нет.
Решил обучать сеть новой стратегии и проводить турниры между последними версиями сети. Со стратегией занять стороны и углы сеть более менее...
@Fell-x27, там сверточные сети использовались и количество входных нейронов 17к+ Плюс еще 13 слоев, которые работают по несколько раз за ход И...
А вот по поводу обучения: Нейрон, который "прослушивает" диагональ 7-56. Синапсы расположены по порядку следования ячеек в диагонали. [IMG] Уже...
@Fell-x27, как раз наоборот. Даже в PHP 5.6 с числами с плавающей точкой я проверял ситуацию работы нейросети равную 1 млн нейронов. На моем CPU с...
Да. Все так. Нейрон стремится всегда выдавать сигнал 0.5. Но это значение он выдаст только в том случае, если на вход подать строго определенную...
Почти так. Нейрон даже не знает, что он в игру играет. Если у него на выходе получился слабый сигнал, но все-же получился - он увеличивает веса (в...
Изменен алгоритм работы сети в игре. Теперь она работает фрагментарно. То-есть раньше делался обход по всем нейронам сети, а теперь запрашиваются...
@Fell-x27, процесс должен быть не марковским. У меня нейроны работают независимо от всей сети. И каждый ход меняют состояние своих весов, что...
Сбросил все веса на 1. До этого в скрытом слое были мной установлены у нейронов разные веса и во время обучения сеть опиралась на них. Теперь она...
В данном случае мутации - это игра с человеком. Эволюционирует она после победы (или ничьей) в двух партиях со своей предыдущей версией - сначала...
Этот алгоритм хорош в плане быстрого получения результата, но в природе его не существует. К тому же человек тоже ошибается. И в данном примере я...
@Fell-x27, разве это не любая обратная связь? Да, в стратегии игры - это не самый показательный момент. Но в плане обучения это может дать...
@Fell-x27, Вы мне подкинули идею. Надо добавить на вход еще и количество съедаемых фишек - тогда будет обучение с подкреплением.
В нейросеть не заложено желание выиграть - она должна к этому прийти в результате эволюции, потому как выживает только тогда когда не проигрывает...