- «Telegram был заблокирован в России — и всё... (5510)
- Anthropic связала склонность Claude к... (3919)
- Поддержка ИИ-моделью DeepSeek V4 ускорителей... (3113)
- Тестовый полёт космического корабля SpaceX... (3154)
- Восстание стиральных машин: программное... (3033)
- Новая статья: Life is Strange: Reunion —... (4229)
- Создан первый логический квантовый процессор... (4707)
- Учёные предложили новую теорию квантовой... (3924)
- «Джеймс Уэбб» обнаружил карликовые галактики... (4339)
- Астрономы обнаружили редчайшую тройную... (3705)
- Масштабное моделирование раскрывает причины... (3478)
- Найден способ масштабировать запутанные... (4001)
- Креативный директор Naughty Dog заинтриговал... (4111)
- Учёные разработали метод точечного... (4207)
- Межзвёздная комета 3I/ATLAS оказалась... (3701)
- Самолёт без рулей X-65 от дочки Boeing стал... (3940)
Искусственный интеллект изучают как мозг: новый этап в понимании «чёрных ящиков»
Дата: 2026-01-20 05:11
Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.
Изображение сгенерировано: Grok Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
Подробнее на iXBT
Предыдущие новости
OpenAI возвращает сооснователей Thinking Machines на ключевые роли
В OpenAI возвращаются Барретт Зоф (Barret Zoph) и Люк Метц (Luke Metz), сооснователи ИИ-стартапа Thinking Machines, основанного в 2024 году. Причины ухода из Thinking Machines вызвали споры. Технологический репортер Кайли Робисон (Kylie Robison) сообщила в X, что Зоф был уволен за «неэтичное поведение». Источник, близкий к Thinking Machines, утверждает, что Зоф делился...
Описана сложная зависимость эффекта Холла от температуры в металлах
Учёные из Института науки Токио предложили новую теорию для объяснения необычной температурной зависимости и смены знака аномального эффекта Холла (AHE) в металлах с высокой проводимостью. Аномальный эффект Холла возникает, когда электрический ток, проходящий через магнитный металл, создаёт напряжение, перпендикулярное току, даже в отсутствие внешнего магнитного поля (в...
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
Учёные из Университета штата Огайо и Чикагского университета предложили использовать дислокации — линейные дефекты в кристаллической решётке алмаза— для создания масштабируемых квантовых технологий. Результаты исследования показывают, что дислокации могут служить «квантовыми магистралями» для соединения кубитов. Исследователи провели моделирование с использованием передовых...
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
Компания Oshen, основанная в 2022 году, разработала флот автономных микро-роботов C-Stars, предназначенных для сбора данных об океане. В 2025 году эти роботы впервые успешно собрали данные непосредственно во время урагана 5-й категории. C-Stars способны автономно работать в океане до 100 дней. В преддверии сезона ураганов 2025 года Национальное управление океанических и...