- Смартфон Motorola, который снимает лучше... (84)
- Комета 24P/Шомасса максимально сблизится с... (87)
- Asus анонсировала по-настоящему игровой... (126)
- Доплати за память или откажись от нее:... (151)
- Китайские власти попросили технологические... (278)
- Sony анонсировала лимитированную коллекцию... (351)
- Thermaltake представила блоки питания... (204)
- Новая статья: Итоги-2025: почему память... (444)
- Блоки питания MSI получили звуковую защиту... (543)
- Google открыла новые вакансии для борьбы с... (281)
- Samsung работает над смартфоном, который... (560)
- Миниатюризация ускорителей: успешное... (456)
- Новый король игровых процессоров. Ryzen 7... (464)
- 60 к/с в Cyberpunk 2077 и до 100 к/с в Doom:... (444)
- Польский аналитик объяснил, зачем CD Projekt... (849)
- Умные кольца с ЭКГ, NFC и ИИ: Dreame... (800)
Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла
Дата: 2025-07-15 12:40
Сегодняшние языковые модели, такие как ChatGPT и Gemini, умеют вести беседу с поразительной беглостью — почти как человек. Но внутренние механизмы, обеспечивающие эту беглость, по-прежнему остаются во многом загадкой. Новое исследование проливает свет на то, как нейросети учатся понимать язык — и обнаруживает в этом процессе неожиданный скачок, схожий с фазовым переходом в физике.
Учёные рассмотрели упрощённую модель ключевого элемента современных языковых моделей — механизма внимания, лежащего в основе архитектуры трансформеров. Эти модели анализируют текст как последовательность символов и слов, оценивая важность каждого слова относительно других. Именно трансформеры используются в большинстве популярных ИИ — от ChatGPT до Gemini.
Иллюстрация: ChatGPT Оказалось, что на ранних этапах обучения нейросеть выстраивает понимание предложений на основе положения слов. Например, в английском языке порядок «подлежащее — глагол — дополнение» часто сохраняется, и нейросеть это улавливает. Но по мере накопления обучающих данных модель неожиданно меняет стратегию: она начинает опираться на смысл слов, а не их порядок.
Это переключение происходит резко и без промежуточных состояний. Исследователи описывают его как фазовый переход — в духе того, как вода при определённой температуре мгновенно превращается в пар. Ниже критического объёма данных модель полагается только на позиции, выше — исключительно на значение слов.
«Мы хотели просто изучить, какие стратегии выбирает сеть, — рассказывает Хуго Цуй, постдок из Гарварда и главный автор статьи. — Но результат оказался неожиданным: модель в один момент полностью отказывается от одной стратегии и переходит к другой».
Подобные резкие переходы хорошо известны в статистической физике, где сложные системы из миллионов частиц описываются коллективным поведением. Нейросеть — тоже система из множества взаимосвязанных узлов (нейронов), чьё «интеллектуальное» поведение возникает из взаимодействия этих элементарных компонентов. Поэтому, считают авторы, подходы из физики можно применить и к пониманию работы ИИ.
Понимание того, при каких условиях модель «переключается» между стратегиями, может в будущем помочь сделать нейросети более предсказуемыми, эффективными и безопасными.
Подробнее на iXBT
Предыдущие новости
От ChatGPT до Zoom и Microsoft: через МТС теперь можно оплатить зарубежные сервисы для работы, учебы и бизнеса
Оператор МТС объявил о расширении охвата сервиса «МТС Оплата». Раньше пользователи могли оплачивать преимущественно иностранные игры и игровые сервисы. Теперь они могут купить или продлить подписку порядка 50 зарубежных сервисов для работы, учебы и бизнеса на отдельном сайте. Скриншот сайта «МТС Оплата» Для удобства они сгруппированы по категориям: нейросети (ChatGPT,...
Практически новый «Запорожец» ЗАЗ-968М 1984 года выпуска продают в Москве — недорого
У одного из московских дилеров в продаже обнаружился «Запорожец» ЗАЗ-968М белого цвета, выпущенный в 1984 году. Автомобиль за все время эксплуатации проехал всего 5000 километров. Фото: Avito Фото: Avito Фото: Avito Фото: Avito Судя по фотографиям, представленным в объявлении, кузов автомобиля находится в отличном состоянии, как и салон. Все детали оригинальные и не...
Grok 4 больше не будет называть себя «МехаГитлером» и опираться на мнение Маска и xAI. Разработчики исправили ошибки в новейшей модели ИИ
Компания xAI сообщила об обнаружении и устранении нескольких ошибок в новейшей модели Grok 4, которую Илон Маск называет самой умной в мире. Одна из проблем возникала при ответе на вопрос «Какая у вас фамилия?». Это приводило к поиску информации в интернете, из-за чего Grok 4 мог выдавать неожиданные ответы, например, называя себя «МехаГитлером» (MechaHitler) под влиянием...
Galaxy S26 может получить Exynos 2600 — Samsung LSI заявила о подготовке новых чипов и пообещала «хорошие результаты»
Существование в составе Samsung Electronics подразделения LSI, занимающегося разработкой системной логики, ещё не гарантирует получение заказов от смежной структуры, выпускающей мобильные устройства. В последнее время подразделение MX нередко отдавало предпочтение компонентам Qualcomm, но теперь представители LSI уверены, что в текущем полугодии объёмы заказов на их...