- Honor выпустила смартфон Magic8 Lite с... (793)
- За Warner Bros разгорелась агрессивная битва... (436)
- Оперативка по цене самой мощной видеокарты:... (527)
- «Мы всё починим!»: долгожданный пятый эпизод... (566)
- ChatGPT вырос в восемь раз: OpenAI показала,... (548)
- Asgard представила новый комплект памяти... (565)
- Бессменный босс Tekken и несостоявшийся... (589)
- Даже нефлагманский iGPU Intel Arc B370... (521)
- 9 декабря «Союз МС-27» вернётся на Землю... (572)
- Привели рынок к катастрофе, а теперь дают... (693)
- Люди всё чаще используют в письменной речи... (545)
- Люди всё чаще используют письменной речи... (859)
- Киноправа на «Гарри Поттера» в итоге... (607)
- 10 050 мА·ч, стилус и 12-дюймовый экран.... (485)
- Xiaomi более чем довольна прибылью, которую... (686)
- OLED, 1440p и 240 Гц за $500: MSI выпустила... (754)
Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла
Дата: 2025-07-15 12:40
Сегодняшние языковые модели, такие как ChatGPT и Gemini, умеют вести беседу с поразительной беглостью — почти как человек. Но внутренние механизмы, обеспечивающие эту беглость, по-прежнему остаются во многом загадкой. Новое исследование проливает свет на то, как нейросети учатся понимать язык — и обнаруживает в этом процессе неожиданный скачок, схожий с фазовым переходом в физике.
Учёные рассмотрели упрощённую модель ключевого элемента современных языковых моделей — механизма внимания, лежащего в основе архитектуры трансформеров. Эти модели анализируют текст как последовательность символов и слов, оценивая важность каждого слова относительно других. Именно трансформеры используются в большинстве популярных ИИ — от ChatGPT до Gemini.
Иллюстрация: ChatGPT Оказалось, что на ранних этапах обучения нейросеть выстраивает понимание предложений на основе положения слов. Например, в английском языке порядок «подлежащее — глагол — дополнение» часто сохраняется, и нейросеть это улавливает. Но по мере накопления обучающих данных модель неожиданно меняет стратегию: она начинает опираться на смысл слов, а не их порядок.
Это переключение происходит резко и без промежуточных состояний. Исследователи описывают его как фазовый переход — в духе того, как вода при определённой температуре мгновенно превращается в пар. Ниже критического объёма данных модель полагается только на позиции, выше — исключительно на значение слов.
«Мы хотели просто изучить, какие стратегии выбирает сеть, — рассказывает Хуго Цуй, постдок из Гарварда и главный автор статьи. — Но результат оказался неожиданным: модель в один момент полностью отказывается от одной стратегии и переходит к другой».
Подобные резкие переходы хорошо известны в статистической физике, где сложные системы из миллионов частиц описываются коллективным поведением. Нейросеть — тоже система из множества взаимосвязанных узлов (нейронов), чьё «интеллектуальное» поведение возникает из взаимодействия этих элементарных компонентов. Поэтому, считают авторы, подходы из физики можно применить и к пониманию работы ИИ.
Понимание того, при каких условиях модель «переключается» между стратегиями, может в будущем помочь сделать нейросети более предсказуемыми, эффективными и безопасными.
Подробнее на iXBT
Предыдущие новости
От ChatGPT до Zoom и Microsoft: через МТС теперь можно оплатить зарубежные сервисы для работы, учебы и бизнеса
Оператор МТС объявил о расширении охвата сервиса «МТС Оплата». Раньше пользователи могли оплачивать преимущественно иностранные игры и игровые сервисы. Теперь они могут купить или продлить подписку порядка 50 зарубежных сервисов для работы, учебы и бизнеса на отдельном сайте. Скриншот сайта «МТС Оплата» Для удобства они сгруппированы по категориям: нейросети (ChatGPT,...
Практически новый «Запорожец» ЗАЗ-968М 1984 года выпуска продают в Москве — недорого
У одного из московских дилеров в продаже обнаружился «Запорожец» ЗАЗ-968М белого цвета, выпущенный в 1984 году. Автомобиль за все время эксплуатации проехал всего 5000 километров. Фото: Avito Фото: Avito Фото: Avito Фото: Avito Судя по фотографиям, представленным в объявлении, кузов автомобиля находится в отличном состоянии, как и салон. Все детали оригинальные и не...
Grok 4 больше не будет называть себя «МехаГитлером» и опираться на мнение Маска и xAI. Разработчики исправили ошибки в новейшей модели ИИ
Компания xAI сообщила об обнаружении и устранении нескольких ошибок в новейшей модели Grok 4, которую Илон Маск называет самой умной в мире. Одна из проблем возникала при ответе на вопрос «Какая у вас фамилия?». Это приводило к поиску информации в интернете, из-за чего Grok 4 мог выдавать неожиданные ответы, например, называя себя «МехаГитлером» (MechaHitler) под влиянием...
Galaxy S26 может получить Exynos 2600 — Samsung LSI заявила о подготовке новых чипов и пообещала «хорошие результаты»
Существование в составе Samsung Electronics подразделения LSI, занимающегося разработкой системной логики, ещё не гарантирует получение заказов от смежной структуры, выпускающей мобильные устройства. В последнее время подразделение MX нередко отдавало предпочтение компонентам Qualcomm, но теперь представители LSI уверены, что в текущем полугодии объёмы заказов на их...