- Классическая стратегия спустя 40 лет... (5739)
- «Росатом» разработал технологию производства... (5792)
- Google расширяет партнёрство с Минобороны... (7378)
- Падение «Ван Аллена»: 600-килограммовый... (6181)
- ИИ-приложения теряют пользователей быстрее... (6022)
- Китайская LisuanTech представила игровую... (5630)
- Впервые в автомобилях Belgee: раскрыто... (6284)
- NASA назначило новую дату возвращения людей... (5496)
- У американских законодателей возникли... (5424)
- Microsoft вскоре потеряет куратора Windows,... (6130)
- Странный эксперимент отлично сработал:... (6900)
- Клиент не всегда прав: психоделический... (6195)
- До 64 ГБ ОЗУ, SSD Phison до 16 ТБ и до 180... (5595)
- NASA начало искать потенциально обитаемые... (5983)
- Федеральный суд США заблокировал работу... (5917)
- ByteDance нашла обход санкций США — её ИИ... (5474)
Искусственный интеллект изучают как мозг: новый этап в понимании «чёрных ящиков»
Дата: 2026-01-20 05:11
Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.
Изображение сгенерировано: Grok Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
Подробнее на iXBT
Предыдущие новости
OpenAI возвращает сооснователей Thinking Machines на ключевые роли
В OpenAI возвращаются Барретт Зоф (Barret Zoph) и Люк Метц (Luke Metz), сооснователи ИИ-стартапа Thinking Machines, основанного в 2024 году. Причины ухода из Thinking Machines вызвали споры. Технологический репортер Кайли Робисон (Kylie Robison) сообщила в X, что Зоф был уволен за «неэтичное поведение». Источник, близкий к Thinking Machines, утверждает, что Зоф делился...
Описана сложная зависимость эффекта Холла от температуры в металлах
Учёные из Института науки Токио предложили новую теорию для объяснения необычной температурной зависимости и смены знака аномального эффекта Холла (AHE) в металлах с высокой проводимостью. Аномальный эффект Холла возникает, когда электрический ток, проходящий через магнитный металл, создаёт напряжение, перпендикулярное току, даже в отсутствие внешнего магнитного поля (в...
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
Учёные из Университета штата Огайо и Чикагского университета предложили использовать дислокации — линейные дефекты в кристаллической решётке алмаза— для создания масштабируемых квантовых технологий. Результаты исследования показывают, что дислокации могут служить «квантовыми магистралями» для соединения кубитов. Исследователи провели моделирование с использованием передовых...
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
Компания Oshen, основанная в 2022 году, разработала флот автономных микро-роботов C-Stars, предназначенных для сбора данных об океане. В 2025 году эти роботы впервые успешно собрали данные непосредственно во время урагана 5-й категории. C-Stars способны автономно работать в океане до 100 дней. В преддверии сезона ураганов 2025 года Национальное управление океанических и...