- 60-ваттная зарядка Samsung Galaxy S26 Ultra... (1372)
- Для тех, кому ездить много и дешево.... (1392)
- Character.AI и Google урегулировали иски о... (1312)
- LMArena привлекла $150 млн и стала... (1423)
- Caterpillar внедряет ИИ от Nvidia для... (1443)
- NASA не исключает экстренное возвращение с... (1278)
- Новейшую Lada Vesta Sport 2026 с пакетом... (1349)
- Новейшую Lada Vesta Sport 2025 с пакетом... (1263)
- Новейшую Lada Vesta Sport 2025 с пакетом... (1384)
- Токамак MAST Upgrade в Великобритании... (1217)
- Опубликовано самое длительное 25-летнее... (1352)
- Компактный, тонкий и легкий Honor Magic 8... (1341)
- Представлена физически согласованная теория... (1251)
- Производитель легендарных электрогитар... (1224)
- Первые тесты мощнейшей встроенной графики... (1231)
- 9000 мАч, 80 Вт, 144 Гц, Snapdragon 7s Gen4,... (1324)
Искусственный интеллект обманул ожидания: разработчики работают медленнее с ИИ-инструментами
Дата: 2025-07-13 17:04
Недавнее исследование некоммерческой исследовательской группы METR (Model Evaluation & Threat Research) ставит под сомнение заявления о повышении производительности разработчиков программного обеспечения благодаря инструментам на основе искусственного интеллекта, таким как Cursor и GitHub Copilot. В ходе рандомизированного контролируемого эксперимента, в котором приняли участие 16 опытных разработчиков, выполнявших 246 реальных задач в крупных репозиториях, исследователи обнаружили неожиданный результат.
Разработчики, участвовавшие в исследовании, предполагали, что использование инструментов ИИ сократит время выполнения задач на 24%. Однако на практике использование инструментов, таких как Cursor Pro (доступ к которому был предоставлен примерно половине участников), привело к увеличению времени выполнения на 19%. Это означает, что разработчики работали медленнее, используя ИИ-инструменты.
Примечательно, что только 56% участников имели опыт работы с Cursor, основным инструментом ИИ, использованным в исследовании. Хотя почти все разработчики (94%) имели опыт использования веб-ориентированных больших языковых моделей (LLM) в своих рабочих процессах, для некоторых участников это исследование стало первым опытом работы именно с Cursor. Несмотря на проведённое обучение, результаты оказались неожиданными.
Иллюстрация: Leonardo Исследователи METR предполагают несколько причин, объясняющих замедление работы разработчиков. Значительное время тратилось на формулировку запросов к ИИ и ожидание ответа, что отнимало время от непосредственно написания кода. Кроме того, ИИ испытывал трудности при работе с большими и сложными базами, которые использовались в эксперименте.
Авторы исследования подчёркивают, что полученные результаты не должны интерпретироваться как полное отрицание преимуществ ИИ-инструментов. Они признают существование других масштабных исследований, демонстрирующих повышение производительности разработчиков при использовании таких инструментов. Также отмечается быстрый прогресс в области ИИ и вероятность получения других результатов даже через три месяца. METR подтверждает значительное улучшение способностей ИИ-инструментов к выполнению сложных задач в последние годы.
Тем не менее, исследование добавляет ещё один аргумент к существующим сомнениям в отношении заявленных преимуществ инструментов кодирования на основе ИИ. Известно, что такие инструменты могут вносить ошибки и, в некоторых случаях, создавать уязвимости безопасности. Поэтому, несмотря на обещания повышения производительности, результаты исследования показывают, что разработчикам не следует ожидать мгновенного увеличения скорости работы при использовании ИИ-инструментов.
Подробнее на iXBT
Предыдущие новости
У АвтоВАЗа минус один конкурент: «Моторинвест» не будет выпускать чисто бензиновые машины
Завод «Моторинвест» в Липецкой области будет выпускать только гибриды и электромобили, чисто бензиновых машин на конвейере не будет. Об этом рассказал директор департамента корпоративных продаж компании Алексей Конураев. Фото: Voyah «Сборку бензиновых машин мы с удовольствием уступили нашим коллегам — другим производственным центрам. Сейчас у компании два проекта – Voyah и...
Будущее водородных автомобилей под вопросом? Honda откладывает запуск гигантского завода по производству топливных элементов
Honda внесла коррективы в план по запуску завода по производству топливных элементов нового поколения в городе Мока, префектура Тотиги, Япония. Изначально планировалось использовать часть территории и зданий бывшего завода Honda Powertrain Unit в Мока и начать производство к 31 марта 2028 года (конец финансового года FY2028), достигнув годовой мощности в 30 000 единиц....
Honor выпустит флагманский смартфон формата мини — Honor Magic 8 Mini будет конкурировать с Samsung Galaxy S26
Инсайдер, известный в соцсети Weibo под ником The director of the factory is classmate Guan, сообщил о том, что в будущей линейке флагманов Honor будет три модели, третьей станет Magic 8 Mini. Он станет конкурировать с Vivo X200 FE, OnePlus 13s, а также, в перспективе, с Samsung Galaxy S26. Также в серии выйдет стандартный Magic 8 и версия Magic 8 Pro. Honor Magic 7 Pro....
Новый научный центр в Лондоне исследует сознание животных
В Лондонской школе экономики и политических наук (LSE) начал работу Центр изучения сознания животных имени Джереми Коллера. Эта организация займется эмпирическим исследованием сознания животных, включая представителей самых разных видов – от насекомых и ракообразных до головоногих моллюсков. Финансирование центра, рассчитанное на несколько лет, обеспечено...