- Ноутбук Dell XPS 14 проработал в режиме... (3789)
- Лабиринт откроет двери на следующей неделе:... (3905)
- Первый готовый ПК с новым процессором Ryzen... (3902)
- Заказал один SSD за 200 долларов, а получит... (4420)
- Смартфон с 52-герцевым цветным экраном E Ink... (3507)
- А есть в этом смартфоне что-то кроме... (3761)
- Китайские компании активно отъедают долю у... (3752)
- Текущее снижение цен на память — затишье... (3664)
- Киберпанк для панка: мозговые импланты... (3205)
- Стратегия Stormgate от экс-разработчиков... (3564)
- Китайский мини-ПК в форме шайбы от Lenovo... (3363)
- SpaceX подала заявку на IPO, которое... (3580)
- AUO заявила о разработке первого в мире 24″... (3730)
- Sony впервые за шесть лет изменит дизайн... (3765)
- Anthropic вспомнила об авторских правах —... (3630)
- За год с небольшим Роскосмос запустил 130... (3563)
Искусственный интеллект изучают как мозг: новый этап в понимании «чёрных ящиков»
Дата: 2026-01-20 05:11
Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.
Изображение сгенерировано: Grok Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
Подробнее на iXBT
Предыдущие новости
OpenAI возвращает сооснователей Thinking Machines на ключевые роли
В OpenAI возвращаются Барретт Зоф (Barret Zoph) и Люк Метц (Luke Metz), сооснователи ИИ-стартапа Thinking Machines, основанного в 2024 году. Причины ухода из Thinking Machines вызвали споры. Технологический репортер Кайли Робисон (Kylie Robison) сообщила в X, что Зоф был уволен за «неэтичное поведение». Источник, близкий к Thinking Machines, утверждает, что Зоф делился...
Описана сложная зависимость эффекта Холла от температуры в металлах
Учёные из Института науки Токио предложили новую теорию для объяснения необычной температурной зависимости и смены знака аномального эффекта Холла (AHE) в металлах с высокой проводимостью. Аномальный эффект Холла возникает, когда электрический ток, проходящий через магнитный металл, создаёт напряжение, перпендикулярное току, даже в отсутствие внешнего магнитного поля (в...
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
Учёные из Университета штата Огайо и Чикагского университета предложили использовать дислокации — линейные дефекты в кристаллической решётке алмаза— для создания масштабируемых квантовых технологий. Результаты исследования показывают, что дислокации могут служить «квантовыми магистралями» для соединения кубитов. Исследователи провели моделирование с использованием передовых...
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
Компания Oshen, основанная в 2022 году, разработала флот автономных микро-роботов C-Stars, предназначенных для сбора данных об океане. В 2025 году эти роботы впервые успешно собрали данные непосредственно во время урагана 5-й категории. C-Stars способны автономно работать в океане до 100 дней. В преддверии сезона ураганов 2025 года Национальное управление океанических и...