- GlobalFoundries потратит $16 млрд на... (1529)
- Утечка: для Cyberpunk 2077 выйдет ещё одно... (1390)
- На Мосбирже стартовали первые в России торги... (1640)
- Gemini покажет изменения, внесённые... (1594)
- Учёные NASA завершили планирование очередной... (1629)
- Гиганты автопрома объединились для... (2013)
- «Отражает наши амбиции»: в CDPR уклонились... (1922)
- «Ниву» впервые выставили на аукцион... (1902)
- Роскосмос успешно протестировал модель... (1811)
- Побит мировой рекорд по разгону GPU —... (1759)
- Сверхтонкий Galaxy S25 Edge провалился сразу... (1974)
- По миру распространился вирус Crocodilus —... (1779)
- Samsung проведёт зачистку неактивных... (1799)
- Вышли обзоры Radeon RX 9060 XT 16GB —... (1951)
- Режиссёр Elden Ring Nightreign победил всех... (1574)
- У BMW X1, ввезенных в Россию из Китая,... (1722)
Цифровые ископаемые: как опечатка 1959 года стала кошмаром для GPT-4o и научных журналов
Дата: 2025-04-19 08:49
«Вегетативная электронная микроскопия» — этот наукообразный, но абсолютно бессмысленный термин — как цифровое проклятие кочует по научным статьям, ответам нейросетей и даже рецензируемым журналам. Учёные раскрыли цепь событий, из-за которых опечатка 70-летней давности стала глобальной проблемой, угрожающей достоверности исследований.
Всё началось с технической ошибки при оцифровке статей 1959 года о бактериях. Программа для сканирования спутала колонки текста, склеив слова «вегетативный» и «электронный» в абсурдный гибрид. Этот артефакт, названный «цифровым ископаемым», десятилетиями сохранялся в данных, пока современные нейросети не начали массово его воспроизводить. Когда исследователи проверили модели вроде GPT-4o и Claude 3.5, те уверенно вставляли бессмыслицу в тексты, принимая её за реальный термин. При этом старые версии — GPT-2 или BERT — такой ошибки не допускали, что помогло установить момент «заражения» данных.

Ошибка оказалась цепкой из-за двух факторов. Во-первых, гигантские хранилища вроде CommonCrawl, откуда нейросети берут информацию, содержат петабайты данных — вручную исправить всё невозможно. Во-вторых, человеческие оплошности усилили проблему. Например, в иранских исследованиях термин, возможно, возник из-за опечатки при переводе с фарси: слова «вегетативный» и «сканирующий» отличаются всего одной точкой в персидской письменности. Нейросети затем растиражировали эту ошибку, сделав её частью «научного ландшафта».
Издатели усугубляют ситуацию. Elsevier сначала пытался оправдать термин, а журнал Frontier в прошлом году отозвал статью с AI-сгенерированными изображениями гениталий крыс — ещё один пример последствий бездумного использования технологий. Учёные из Гарварда также отмечают рост «мусорной науки» в Google Scholar, где поисковик вылавливает псевдонаучные материалы.
Ситуация раскрывает системную уязвимость: чем больше ИИ анализирует данные, тем выше риск, что ошибки станут восприниматься как истина. Исправить это в глобальном масштабе почти невозможно — остаётся полагаться на улучшение фильтрации данных и ответственность разработчиков. Однако пока «цифровые ископаемые» остаются в недрах интернета, они будут периодически всплывать, подрывая доверие к технологиям, которые призваны укреплять научный прогресс.
Подробнее на iXBT
Предыдущие новости
Единственный флагман без вырезов и отверстий, с IP68, крошечной рамкой и топовой 35-мм камерой. Представлен Nubia Z70S Ultra Photographer Edition
Nubia официально объявила о запуске Z70S Ultra Photographer Edition, запланированном на 28 апреля. Компания раскрыла дизайн устройства, которое получило топовую камеру и безрамочный экран, не имеющий вырезов. Устройство будет запущено вместе с загадочным продуктом на презентации Nubia AI Dual Flagship New Product Launch. Фото Nubia Задняя конструкция разделяет основную и...
Ученые разрабатывают компактные ускорители частиц с Wakefield-ускорением, сокращающие размер коллайдеров на 99%
Международная команда исследователей работает над созданием радикально уменьшенных и более дешевых ускорителей частиц, применяя технику Wakefield-ускорения, изучавшуюся с 1970-х годов. Технология использует плазменные волны, создаваемые лазером или пучком частиц, и позволяет ускорять электроны до высоких энергий в десятки раз быстрее, чем традиционные методы, применяемые в...
Кроме SpaceX, так не может никто в мире: компания запустит три абсолютно разные миссии за два дня
Компания SpaceX планирует с 20 по 21 апреля 2025 запустить три важные миссии при помощи ракет Falcon 9. Сначала будет запущена пятая в этом году миссия для Национального управления военно-космической разведки США (NRO), которая стартует в воскресенье, 20 апреля. Ранее NRO запустило девятую миссию по поддержке своей спутниковой группировки Starshield с расширенной архитектурой....
Совершенно новый Haval F7 с расходом менее 1 л на 100 км, который ждут в России, уже стал хитом: всего за сутки продано более 16 000 машин
Компания Great Wall Motor представила гибридный внедорожник Haval F7 (Haval Xiaolong Max) второго поколения на этой неделе, подтвердив, что новинка доступна в пяти комплектациях по цене от 18 000 до 23 300 долларов. За первые 24 часа после запуска автомобиль собрал 16 368 оплаченных заказов. Фото Great Wall Motor Среднеразмерный кроссовер с габаритами 4780×1895×1725 мм и...