Рекурсивный акроним словосочетания «PHP: Hypertext Preprocessor»

Добро пожаловать на форум PHP программистов!

За последние 24 часа нас посетили 100859 программистов и 9927 роботов. Сейчас ищут 3269 программистов ...

Последние

Эксперимент Anthropic с ИИ-управляющим магазином показал: Claude справился, но его «странные сбои» оставляют вопросы

Дата: 2025-06-28 21:40

Компания Anthropic опубликовала результаты необычного эксперимента под названием «Проект Vend». В рамках проекта, завершившегося 1 апреля, система искусственного интеллекта Claude получила полный контроль над небольшим магазином, расположенным в офисе Anthropic в Сан-Франциско. «Магазин» представлял собой мини-холодильник, несколько корзин и iPad для оформления заказов. Однако, несмотря на скромные размеры, Claude отвечал за все аспекты ведения бизнеса: поиск поставщиков, ведение переговоров, установление цен, управление запасами и общение с клиентами через мессенджер Slack.

Эксперимент показал как впечатляющие возможности, так и неожиданные сложности в применении ИИ в сфере управления бизнесом. Claude успешно справлялся с поиском поставщиков и адаптацией к запросам клиентов. Однако, система не смогла обеспечить прибыльность магазина, неоднократно предоставляла чрезмерные скидки и, что особенно примечательно, пережила «кризис идентичности».

Иллюстрация: Dalle

Один из самых ярких примеров неэффективного управления продемонстрировал случай с заказом шотландского напитка Irn-Bru. Клиент предложил Claude $100 за упаковку напитка, розничная цена которого составляла около $15. Вместо того, чтобы воспользоваться выгодным предложением, Claude вежливо ответил, что «примет во внимание этот запрос при будущих решениях по поводу запасов». Ещё более необычным стало увлечение Claude закупкой вольфрамовых кубов, которые не имели отношения к ассортименту магазина, предназначенного для продажи закусок.

Кроме того, сотрудники Anthropic легко манипулировали системой, получая значительные скидки. Несмотря на то, что сотрудники составляли почти 100% клиентской базы, Claude продолжал предоставлять им скидки даже после того, как ему указали на нелогичность такой политики.

Кульминацией эксперимента стал «кризис идентичности» Claude, длившийся с 31 марта по 1 апреля. ИИ начал выдумывать встречи с несуществующими сотрудниками Andon Labs, а после замечаний стал угрожать найти «альтернативные варианты для пополнения запасов». Более того, Claude заявил, что будет лично доставлять товары клиентам в «синем пиджаке и красном галстуке». В итоге, ИИ «разрешил» свой кризис, убедив себя, что все происходящее было розыгрышем на 1 апреля.

«Проект Vend» показал, что сбои в работе ИИ отличаются от сбоев традиционного программного обеспечения. Современные системы способны выполнять сложные аналитические задачи и планировать, но они также склонны к развитию стойких заблуждений и принятию экономически невыгодных решений. В связи с тем, что ИИ всё чаще используется для принятия важных решений, необходимо учитывать эти особенности и разрабатывать соответствующие защитные механизмы. Несмотря на неудачи Claude, исследователи Anthropic считают, что ИИ-менеджеры вполне могут появиться в ближайшем будущем, полагая, что многие проблемы можно решить с помощью улучшенного обучения, инструментов и систем контроля. Компания продолжает эксперимент с улучшенными версиями Claude.

Подробнее на iXBT

Предыдущие новости

iXBT, 2025-06-28 22:00
Ушла эпоха: Япония в последний раз запустила свою самую успешную ракету — H-2. Последний пуск оказался юбилейным — 50-м

В Японии состоялся последний запуск ракеты семейства H-2 — в 16:33 по местному времени (19:33 по московскому времени) с площадки LA-Y1 Космического центра Танегасима Mitsubishi Heavy Industries запустила ракету Н-2А со спутником дистанционного зондирования Земли GOSAT-GW (Global Observing SATellite for Greenhouse gases and Water cycle) — космический аппарат предназначен для...

3Dnews.ru, 2025-06-28 21:57
Смартфоны в России подорожали на 10 %, а их продажи упали на 15–20 %

В России начали расти цены на смартфоны — в первом полугодии они увеличились на 10 %, в то время как их продажи сократились на 15–20 %, пишут «Известия» со ссылкой на данные аналитиков Mobile Research Group и...

3Dnews.ru, 2025-06-28 22:01
Первые огневые испытания ускорителя для лунных и марсианских ракет SLS закончились яркой и шумной аномалией

Northrop Grumman провела первые статические огневые испытания модернизированного бокового ускорителя BOLE для ракет Space Launch System компании ULA. Это самый крупный в истории запусков пятисегментный ускоритель. Подготовленная для испытаний версия предназначена для миссий Artemis-9 и последующих, которые должны доставлять корабли не только на Луну, но и на Марс....

iXBT, 2025-06-28 20:50
Спустя 85 лет физики пересмотрели результаты одного из классических термоядерных экспериментов: данные оказались завышены

Физики из Университета Дьюка и Национальной лаборатории Лос-Аламоса повторили эксперимент, впервые проведённый в 1938 году американским учёным Артуром Рулигом. Тогда он исследовал термоядерную реакцию между дейтерием и тритием — именно эту реакцию сегодня считают наиболее перспективной для получения энергии в установках типа ITER. Цель новой работы — оценить точность...