- Мощнее тротила: Китай испытал революционную... (242)
- Oukitel покажет на выставке «Связь-2025»... (258)
- Mercedes-Benz перезапускает V-класс с... (277)
- OpenAI заподозрили в манипуляциях с тестами... (261)
- Cyberpunk 2077 стала первой подтверждённой... (252)
- «Это даже не скидка, это беспрецедентный... (248)
- Яндекс разрабатывает отображение сигналов... (255)
- Такого в мире ещё не было: ОАЭ первыми в... (257)
- Lada Sport не берут? Стоянка АвтоВАЗа забита... (238)
- От Луны к Марсу за 14 месяцев: NASA... (223)
- Загадочное отверстие обнаружено на Марсе:... (132)
- Олдскульная стратегия Tempest Rising в духе... (137)
- Kia готовит почву к возвращению в Россию:... (124)
- «Дракон» в небе. Ракета Falcon 9 вывела на... (143)
- Первая пожизненная гарантия на авто для... (115)
- Скидки на Lada достигают сотен тысяч рублей... (127)
Цифровые ископаемые: как опечатка 1959 года стала кошмаром для GPT-4o и научных журналов
Дата: 2025-04-19 08:49
«Вегетативная электронная микроскопия» — этот наукообразный, но абсолютно бессмысленный термин — как цифровое проклятие кочует по научным статьям, ответам нейросетей и даже рецензируемым журналам. Учёные раскрыли цепь событий, из-за которых опечатка 70-летней давности стала глобальной проблемой, угрожающей достоверности исследований.
Всё началось с технической ошибки при оцифровке статей 1959 года о бактериях. Программа для сканирования спутала колонки текста, склеив слова «вегетативный» и «электронный» в абсурдный гибрид. Этот артефакт, названный «цифровым ископаемым», десятилетиями сохранялся в данных, пока современные нейросети не начали массово его воспроизводить. Когда исследователи проверили модели вроде GPT-4o и Claude 3.5, те уверенно вставляли бессмыслицу в тексты, принимая её за реальный термин. При этом старые версии — GPT-2 или BERT — такой ошибки не допускали, что помогло установить момент «заражения» данных.

Ошибка оказалась цепкой из-за двух факторов. Во-первых, гигантские хранилища вроде CommonCrawl, откуда нейросети берут информацию, содержат петабайты данных — вручную исправить всё невозможно. Во-вторых, человеческие оплошности усилили проблему. Например, в иранских исследованиях термин, возможно, возник из-за опечатки при переводе с фарси: слова «вегетативный» и «сканирующий» отличаются всего одной точкой в персидской письменности. Нейросети затем растиражировали эту ошибку, сделав её частью «научного ландшафта».
Издатели усугубляют ситуацию. Elsevier сначала пытался оправдать термин, а журнал Frontier в прошлом году отозвал статью с AI-сгенерированными изображениями гениталий крыс — ещё один пример последствий бездумного использования технологий. Учёные из Гарварда также отмечают рост «мусорной науки» в Google Scholar, где поисковик вылавливает псевдонаучные материалы.
Ситуация раскрывает системную уязвимость: чем больше ИИ анализирует данные, тем выше риск, что ошибки станут восприниматься как истина. Исправить это в глобальном масштабе почти невозможно — остаётся полагаться на улучшение фильтрации данных и ответственность разработчиков. Однако пока «цифровые ископаемые» остаются в недрах интернета, они будут периодически всплывать, подрывая доверие к технологиям, которые призваны укреплять научный прогресс.
Подробнее на iXBT
Предыдущие новости
Единственный флагман без вырезов и отверстий, с IP68, крошечной рамкой и топовой 35-мм камерой. Представлен Nubia Z70S Ultra Photographer Edition
Nubia официально объявила о запуске Z70S Ultra Photographer Edition, запланированном на 28 апреля. Компания раскрыла дизайн устройства, которое получило топовую камеру и безрамочный экран, не имеющий вырезов. Устройство будет запущено вместе с загадочным продуктом на презентации Nubia AI Dual Flagship New Product Launch. Фото Nubia Задняя конструкция разделяет основную и...
Ученые разрабатывают компактные ускорители частиц с Wakefield-ускорением, сокращающие размер коллайдеров на 99%
Международная команда исследователей работает над созданием радикально уменьшенных и более дешевых ускорителей частиц, применяя технику Wakefield-ускорения, изучавшуюся с 1970-х годов. Технология использует плазменные волны, создаваемые лазером или пучком частиц, и позволяет ускорять электроны до высоких энергий в десятки раз быстрее, чем традиционные методы, применяемые в...
Кроме SpaceX, так не может никто в мире: компания запустит три абсолютно разные миссии за два дня
Компания SpaceX планирует с 20 по 21 апреля 2025 запустить три важные миссии при помощи ракет Falcon 9. Сначала будет запущена пятая в этом году миссия для Национального управления военно-космической разведки США (NRO), которая стартует в воскресенье, 20 апреля. Ранее NRO запустило девятую миссию по поддержке своей спутниковой группировки Starshield с расширенной архитектурой....
Совершенно новый Haval F7 с расходом менее 1 л на 100 км, который ждут в России, уже стал хитом: всего за сутки продано более 16 000 машин
Компания Great Wall Motor представила гибридный внедорожник Haval F7 (Haval Xiaolong Max) второго поколения на этой неделе, подтвердив, что новинка доступна в пяти комплектациях по цене от 18 000 до 23 300 долларов. За первые 24 часа после запуска автомобиль собрал 16 368 оплаченных заказов. Фото Great Wall Motor Среднеразмерный кроссовер с габаритами 4780×1895×1725 мм и...