- 18-ядерный Intel Core Ultra 5 250KF Plus... (3314)
- Последние часы кометы C/2026 A1, летящей на... (2922)
- Беспроводная оптическая связь внутри... (2973)
- В Японии создали адаптер Wi-Fi, способный... (3378)
- Спутниковое телевидение после аварии вернули... (3221)
- Samsung Galaxy S26 FE засветился в тестах с... (3448)
- Дуров пообещал усложнить обнаружение и... (3036)
- Суд обязал Netflix вернуть деньги за... (3122)
- Anthropic ввела дополнительную плату за... (2966)
- На Perplexity подали в суд за тайную... (2887)
- Техподдержка NASA удалённо починила... (3304)
- Тряску лунного корабля Orion объяснили... (3331)
- 300 Гц чуть дороже $100: Xiaomi представила... (3305)
- Samsung Display в Китае под угрозой: худший... (3526)
- Apple распродала все Mac Studio с 256 Гбайт... (3348)
- Samsung представляет линейку телевизоров... (2916)
Искусственный интеллект изучают как мозг: новый этап в понимании «чёрных ящиков»
Дата: 2026-01-20 05:11
Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.
Изображение сгенерировано: Grok Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
Подробнее на iXBT
Предыдущие новости
OpenAI возвращает сооснователей Thinking Machines на ключевые роли
В OpenAI возвращаются Барретт Зоф (Barret Zoph) и Люк Метц (Luke Metz), сооснователи ИИ-стартапа Thinking Machines, основанного в 2024 году. Причины ухода из Thinking Machines вызвали споры. Технологический репортер Кайли Робисон (Kylie Robison) сообщила в X, что Зоф был уволен за «неэтичное поведение». Источник, близкий к Thinking Machines, утверждает, что Зоф делился...
Описана сложная зависимость эффекта Холла от температуры в металлах
Учёные из Института науки Токио предложили новую теорию для объяснения необычной температурной зависимости и смены знака аномального эффекта Холла (AHE) в металлах с высокой проводимостью. Аномальный эффект Холла возникает, когда электрический ток, проходящий через магнитный металл, создаёт напряжение, перпендикулярное току, даже в отсутствие внешнего магнитного поля (в...
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
Учёные из Университета штата Огайо и Чикагского университета предложили использовать дислокации — линейные дефекты в кристаллической решётке алмаза— для создания масштабируемых квантовых технологий. Результаты исследования показывают, что дислокации могут служить «квантовыми магистралями» для соединения кубитов. Исследователи провели моделирование с использованием передовых...
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
Компания Oshen, основанная в 2022 году, разработала флот автономных микро-роботов C-Stars, предназначенных для сбора данных об океане. В 2025 году эти роботы впервые успешно собрали данные непосредственно во время урагана 5-й категории. C-Stars способны автономно работать в океане до 100 дней. В преддверии сезона ураганов 2025 года Национальное управление океанических и...