- Американские учёные создали чип памяти,... (3589)
- Fujitsu сократит 10 % сотрудников... (3517)
- GeForce RTX 4090 сломалась, потеряла часть... (3718)
- «Мы обречены, нам конец». В Китае продавцы... (3352)
- 34 сверхширокоформатных дюйма всего за 240... (4167)
- Google начнёт принудительный перевод Wear OS... (3718)
- Snapdragon 8 Elite Gen 6 Pro станет заметно... (3256)
- Первый запуск китайской ракеты CAS Space... (3596)
- Иран нанёс новый удар по облачному ЦОД AWS в... (3617)
- Американцы создали память, способную... (3619)
- ИИ-помощник «Ева» от «МегаФона» научилась... (3797)
- Gigabyte анонсировала плату X870E Aero X3D... (3839)
- Удобно устроились: долгосрочные контракты... (3162)
- Опробовать Android 17 теперь могут владельцы... (3471)
- Компактный ПК на новой платформе Intel Lunar... (3184)
- В рамках миссии Artemis II астронавты взяли... (3324)
Искусственный интеллект изучают как мозг: новый этап в понимании «чёрных ящиков»
Дата: 2026-01-20 05:11
Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.
Изображение сгенерировано: Grok Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
Подробнее на iXBT
Предыдущие новости
OpenAI возвращает сооснователей Thinking Machines на ключевые роли
В OpenAI возвращаются Барретт Зоф (Barret Zoph) и Люк Метц (Luke Metz), сооснователи ИИ-стартапа Thinking Machines, основанного в 2024 году. Причины ухода из Thinking Machines вызвали споры. Технологический репортер Кайли Робисон (Kylie Robison) сообщила в X, что Зоф был уволен за «неэтичное поведение». Источник, близкий к Thinking Machines, утверждает, что Зоф делился...
Описана сложная зависимость эффекта Холла от температуры в металлах
Учёные из Института науки Токио предложили новую теорию для объяснения необычной температурной зависимости и смены знака аномального эффекта Холла (AHE) в металлах с высокой проводимостью. Аномальный эффект Холла возникает, когда электрический ток, проходящий через магнитный металл, создаёт напряжение, перпендикулярное току, даже в отсутствие внешнего магнитного поля (в...
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
Учёные из Университета штата Огайо и Чикагского университета предложили использовать дислокации — линейные дефекты в кристаллической решётке алмаза— для создания масштабируемых квантовых технологий. Результаты исследования показывают, что дислокации могут служить «квантовыми магистралями» для соединения кубитов. Исследователи провели моделирование с использованием передовых...
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
Компания Oshen, основанная в 2022 году, разработала флот автономных микро-роботов C-Stars, предназначенных для сбора данных об океане. В 2025 году эти роботы впервые успешно собрали данные непосредственно во время урагана 5-й категории. C-Stars способны автономно работать в океане до 100 дней. В преддверии сезона ураганов 2025 года Национальное управление океанических и...