- Новые версии ChatGPT могут значительно... (188)
- 6,7 миллиона ядер CUDA в 50 коробках.... (98)
- WhatsApp не сможет запустить рекламу в... (85)
- Kioxia анонсировала 61,44-Тбайт SSD CD9P для... (80)
- Как в Google и Netflix: Яндекс запускает... (86)
- Дурову разрешили ездить из Франции в Дубай,... (77)
- Softbank вместе с Nvidia и TSMC предлагает... (74)
- «Наконец-то Uncharted 5»: первый трейлер... (69)
- К «Яндекс Еде» подключили ИИ-ассистент «Еда... (124)
- «Яндекс» встроит ИИ-рекомендации почти во... (130)
- Nvidia заинтересовалась атомной энергетикой... (106)
- Технология Intel 18A обещает сделать... (112)
- С начала июня трафик Cloudflare в России... (77)
- В Китае создали портативную нейтронную пушку... (78)
- ИИ стал экзистенциальной угрозой для... (74)
- Реклама в лондонском метро утверждает, что... (126)
Российские учёные заявили, что создали самый эффективный в мире алгоритм для обучения ИИ: вчетверо быстрее аналогов
Дата: 2023-12-21 09:42
Команда «Тинькофф» поделилась новыми достижениями учёных из Tinkoff Research. Как сообщила пресс-служба, в лаборатории исследований искусственного интеллекта Tinkoff Research создали самый эффективный среди мировых аналогов алгоритм для обучения и адаптации искусственного интеллекта.

В Tinkoff Research рассказали:
Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением), обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу.
Суть открытия в том, что ученые из Tinkoff Research идентифицировали четыре компонента, которые были представлены в алгоритмах последних лет, но считались второстепенными и не подвергались детальному анализу:
Глубина нейронных сетей. Увеличение глубины сети помогает ей лучше понимать сложные закономерности в данных Регуляризация актора и критика. В ИИ-агентах есть два компонента: «актор», который предпринимает действия, и «критик», который оценивает эти действия. Ученые использовали совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик более эффективно оценивал их. Ранее не было понятно, как сочетать оба подхода с наибольшей эффективностью Увеличение эффективного горизонта планирования — позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи и улучшает ее способность принимать решения Использование нормализации слоев (LayerNorm) — стабилизирует процесс обучения нейронных сетейЭти компоненты интегрировали в алгоритм-предшественник BRAC (Behavior Regularized Actor Critic — актор-критик с контролируемым поведением) 2019 года и провели исследование, поочередно варьируя каждый из них. Оказалось, что правильная совокупность этих компонентов дает даже этому старому подходу самую высокую производительность среди лучших аналогов на сегодняшний день. Модифицированный алгоритм получил название ReBRAC.

Тестирование на робототехнических симуляторах показало, что алгоритм обучает ИИ в четыре раза быстрее и на 40% качественнее всех существующих в офлайн-бенчмарках. Ранее лидерство принадлежало алгоритму SAC-RND, также созданному учеными из Tinkoff Research.
Подробнее на iXBT
Предыдущие новости
На московские маршруты вышли новые ГАЗели – впервые с 2016 года
Как сообщает Telegram-канал «Автобусы и вообще», на московские маршруты впервые за восемь лет вышли новенькие ГАЗели – это ГАЗ-A68R52 City с 2,8-литровым дизельным мотором Cummins, которые приобрела частная фирма «Гортакси» для обслуживания контракта с полной оплатой транспортной работы. С момента реформы 2016 года на столичных маршрутах в малом классе допускалась лишь работа...
Первый смартфон на Snapdragon 8 Gen 3 и с поддержкой спутниковой связи. Живое фото Honor Magic6 Pro
В Сети появилось живое фото, демонстрирующее будущий флагман Honor – модель Magic6 Pro. Уже официально подтверждено, что новинка получит поддержку спутниковой связи – и он станет первой моделью на Snapdragon 8 Gen 3 с ее поддержкой. Особых технических подробностей об этой модели пока нет. Известный инсайдер Digital Chat Station лишь сообщал, что аппарат получит новый...
Для всех, кто скучает по Mitsubishi Pajero, Toyota Land Cruiser Prado и Nissan Patrol, Jetour привезет в Россию внедорожник Jetour T2
В российском офисе Jetour сообщили о том, что уже в первом квартале следующего года в России появится внедорожник Jetour T2. Он, судя по всему, станет четвертым автомобилем в линейке, которая сейчас представлена моделями X90 Plus, X70 Plus и Dashing. Фото: Jetour По словам директора направления продаж Jetour ГК Wagner Auto Евгения Пекарского, Jetour T2 станет «полноценным...
Характеристики на уровне Huawei Mate 60. Известный инсайдер рассказал о камере и экране Huawei nova 12 Pro и nova 12 Ultra
Инсайдер Digital Chat Station поделился подробностями о смартфонах Huawei nova 12 Pro и nova 12 Ultra. По его данным, аппараты получат дисплеи с разрешением 1,5К. Фронтальная камера будет представлена комплексом из двух модулей с разрешением 60 и 8 Мп. Первый – со сверхширокоугольным объективом, второй – с телеобъективом с 2-кратным оптическим зумом. В основном модуле главной...