- Apple обязали компенсировать £1,5 млрд... (2003)
- Apple может столкнуться с необходимостью... (2288)
- Первый смартфон с батареей более 10 000 мАч.... (2162)
- Около 90 % сотрудников стартапа Groq... (2405)
- Новая статья: Обзор блока питания MSI MAG... (2467)
- Новая статья: Обзор и тестирование MSI MPG... (2436)
- Новый уровень для Voyah: компания начинает... (2085)
- Народный апгрейд: владельцы Zeekr 001 2024 в... (2763)
- Полностью российская разработка: в Калуге... (2365)
- В Китае запущена первая в мире газовая... (2993)
- ИИ на реактивной тяге: компании в США... (2299)
- Россияне потратили на Geely Monjaro в ноябре... (3161)
- Google хочет забрать из России свои старые... (3040)
- В России начнут выпускать альтернативу... (3077)
- В Китае с 2027 года запретят электромобили с... (2752)
- Belgee, Tenet, Solaris и Toyota входят в... (2325)
Цифровые ископаемые: как опечатка 1959 года стала кошмаром для GPT-4o и научных журналов
Дата: 2025-04-19 08:49
«Вегетативная электронная микроскопия» — этот наукообразный, но абсолютно бессмысленный термин — как цифровое проклятие кочует по научным статьям, ответам нейросетей и даже рецензируемым журналам. Учёные раскрыли цепь событий, из-за которых опечатка 70-летней давности стала глобальной проблемой, угрожающей достоверности исследований.
Всё началось с технической ошибки при оцифровке статей 1959 года о бактериях. Программа для сканирования спутала колонки текста, склеив слова «вегетативный» и «электронный» в абсурдный гибрид. Этот артефакт, названный «цифровым ископаемым», десятилетиями сохранялся в данных, пока современные нейросети не начали массово его воспроизводить. Когда исследователи проверили модели вроде GPT-4o и Claude 3.5, те уверенно вставляли бессмыслицу в тексты, принимая её за реальный термин. При этом старые версии — GPT-2 или BERT — такой ошибки не допускали, что помогло установить момент «заражения» данных.
Вегетативная электронная микроскопия по версии нейросети Leonardo Ошибка оказалась цепкой из-за двух факторов. Во-первых, гигантские хранилища вроде CommonCrawl, откуда нейросети берут информацию, содержат петабайты данных — вручную исправить всё невозможно. Во-вторых, человеческие оплошности усилили проблему. Например, в иранских исследованиях термин, возможно, возник из-за опечатки при переводе с фарси: слова «вегетативный» и «сканирующий» отличаются всего одной точкой в персидской письменности. Нейросети затем растиражировали эту ошибку, сделав её частью «научного ландшафта».
Издатели усугубляют ситуацию. Elsevier сначала пытался оправдать термин, а журнал Frontier в прошлом году отозвал статью с AI-сгенерированными изображениями гениталий крыс — ещё один пример последствий бездумного использования технологий. Учёные из Гарварда также отмечают рост «мусорной науки» в Google Scholar, где поисковик вылавливает псевдонаучные материалы.
Ситуация раскрывает системную уязвимость: чем больше ИИ анализирует данные, тем выше риск, что ошибки станут восприниматься как истина. Исправить это в глобальном масштабе почти невозможно — остаётся полагаться на улучшение фильтрации данных и ответственность разработчиков. Однако пока «цифровые ископаемые» остаются в недрах интернета, они будут периодически всплывать, подрывая доверие к технологиям, которые призваны укреплять научный прогресс.
Подробнее на iXBT
Предыдущие новости
Единственный флагман без вырезов и отверстий, с IP68, крошечной рамкой и топовой 35-мм камерой. Представлен Nubia Z70S Ultra Photographer Edition
Nubia официально объявила о запуске Z70S Ultra Photographer Edition, запланированном на 28 апреля. Компания раскрыла дизайн устройства, которое получило топовую камеру и безрамочный экран, не имеющий вырезов. Устройство будет запущено вместе с загадочным продуктом на презентации Nubia AI Dual Flagship New Product Launch. Фото Nubia Задняя конструкция разделяет основную и...
Ученые разрабатывают компактные ускорители частиц с Wakefield-ускорением, сокращающие размер коллайдеров на 99%
Международная команда исследователей работает над созданием радикально уменьшенных и более дешевых ускорителей частиц, применяя технику Wakefield-ускорения, изучавшуюся с 1970-х годов. Технология использует плазменные волны, создаваемые лазером или пучком частиц, и позволяет ускорять электроны до высоких энергий в десятки раз быстрее, чем традиционные методы, применяемые в...
Кроме SpaceX, так не может никто в мире: компания запустит три абсолютно разные миссии за два дня
Компания SpaceX планирует с 20 по 21 апреля 2025 запустить три важные миссии при помощи ракет Falcon 9. Сначала будет запущена пятая в этом году миссия для Национального управления военно-космической разведки США (NRO), которая стартует в воскресенье, 20 апреля. Ранее NRO запустило девятую миссию по поддержке своей спутниковой группировки Starshield с расширенной архитектурой....
Совершенно новый Haval F7 с расходом менее 1 л на 100 км, который ждут в России, уже стал хитом: всего за сутки продано более 16 000 машин
Компания Great Wall Motor представила гибридный внедорожник Haval F7 (Haval Xiaolong Max) второго поколения на этой неделе, подтвердив, что новинка доступна в пяти комплектациях по цене от 18 000 до 23 300 долларов. За первые 24 часа после запуска автомобиль собрал 16 368 оплаченных заказов. Фото Great Wall Motor Среднеразмерный кроссовер с габаритами 4780×1895×1725 мм и...