- Яндекс запустил бета-версию «Радио»: более... (1561)
- Xiaomi 17 Ultra анонсирован для мирового... (1394)
- «Яндекс Go» теперь можно покупать абонементы... (2036)
- В России представили гибридный внедорожник... (1377)
- Крупнейший солнечный телескоп Евразии,... (1961)
- Самый популярный контентный бот в Telegram:... (1510)
- Xiaomi 17 Ultra Leica Edition вызвал большой... (1536)
- Плюс полтриллиона долларов за год: ИИ-бум... (1958)
- Самый длинный в мире скоростной тоннель... (1863)
- Крупнейшие операторы вернули россиянам... (1816)
- Первый запуск российской ракеты «Союз-5»... (1929)
- Исследование показало, на какие игры в 2025... (1518)
- Редчайший ВАЗ-2106 времён СССР в состоянии... (1138)
- Новый ВАЗ-2106 времён СССР выставлен на... (1508)
- 10 000 мАч, 100 Вт, 185 Гц, IP69K,... (1536)
- Трёхстворчатый складной смартфон Samsung... (1942)
Цифровые ископаемые: как опечатка 1959 года стала кошмаром для GPT-4o и научных журналов
Дата: 2025-04-19 08:49
«Вегетативная электронная микроскопия» — этот наукообразный, но абсолютно бессмысленный термин — как цифровое проклятие кочует по научным статьям, ответам нейросетей и даже рецензируемым журналам. Учёные раскрыли цепь событий, из-за которых опечатка 70-летней давности стала глобальной проблемой, угрожающей достоверности исследований.
Всё началось с технической ошибки при оцифровке статей 1959 года о бактериях. Программа для сканирования спутала колонки текста, склеив слова «вегетативный» и «электронный» в абсурдный гибрид. Этот артефакт, названный «цифровым ископаемым», десятилетиями сохранялся в данных, пока современные нейросети не начали массово его воспроизводить. Когда исследователи проверили модели вроде GPT-4o и Claude 3.5, те уверенно вставляли бессмыслицу в тексты, принимая её за реальный термин. При этом старые версии — GPT-2 или BERT — такой ошибки не допускали, что помогло установить момент «заражения» данных.
Вегетативная электронная микроскопия по версии нейросети Leonardo Ошибка оказалась цепкой из-за двух факторов. Во-первых, гигантские хранилища вроде CommonCrawl, откуда нейросети берут информацию, содержат петабайты данных — вручную исправить всё невозможно. Во-вторых, человеческие оплошности усилили проблему. Например, в иранских исследованиях термин, возможно, возник из-за опечатки при переводе с фарси: слова «вегетативный» и «сканирующий» отличаются всего одной точкой в персидской письменности. Нейросети затем растиражировали эту ошибку, сделав её частью «научного ландшафта».
Издатели усугубляют ситуацию. Elsevier сначала пытался оправдать термин, а журнал Frontier в прошлом году отозвал статью с AI-сгенерированными изображениями гениталий крыс — ещё один пример последствий бездумного использования технологий. Учёные из Гарварда также отмечают рост «мусорной науки» в Google Scholar, где поисковик вылавливает псевдонаучные материалы.
Ситуация раскрывает системную уязвимость: чем больше ИИ анализирует данные, тем выше риск, что ошибки станут восприниматься как истина. Исправить это в глобальном масштабе почти невозможно — остаётся полагаться на улучшение фильтрации данных и ответственность разработчиков. Однако пока «цифровые ископаемые» остаются в недрах интернета, они будут периодически всплывать, подрывая доверие к технологиям, которые призваны укреплять научный прогресс.
Подробнее на iXBT
Предыдущие новости
Единственный флагман без вырезов и отверстий, с IP68, крошечной рамкой и топовой 35-мм камерой. Представлен Nubia Z70S Ultra Photographer Edition
Nubia официально объявила о запуске Z70S Ultra Photographer Edition, запланированном на 28 апреля. Компания раскрыла дизайн устройства, которое получило топовую камеру и безрамочный экран, не имеющий вырезов. Устройство будет запущено вместе с загадочным продуктом на презентации Nubia AI Dual Flagship New Product Launch. Фото Nubia Задняя конструкция разделяет основную и...
Ученые разрабатывают компактные ускорители частиц с Wakefield-ускорением, сокращающие размер коллайдеров на 99%
Международная команда исследователей работает над созданием радикально уменьшенных и более дешевых ускорителей частиц, применяя технику Wakefield-ускорения, изучавшуюся с 1970-х годов. Технология использует плазменные волны, создаваемые лазером или пучком частиц, и позволяет ускорять электроны до высоких энергий в десятки раз быстрее, чем традиционные методы, применяемые в...
Кроме SpaceX, так не может никто в мире: компания запустит три абсолютно разные миссии за два дня
Компания SpaceX планирует с 20 по 21 апреля 2025 запустить три важные миссии при помощи ракет Falcon 9. Сначала будет запущена пятая в этом году миссия для Национального управления военно-космической разведки США (NRO), которая стартует в воскресенье, 20 апреля. Ранее NRO запустило девятую миссию по поддержке своей спутниковой группировки Starshield с расширенной архитектурой....
Совершенно новый Haval F7 с расходом менее 1 л на 100 км, который ждут в России, уже стал хитом: всего за сутки продано более 16 000 машин
Компания Great Wall Motor представила гибридный внедорожник Haval F7 (Haval Xiaolong Max) второго поколения на этой неделе, подтвердив, что новинка доступна в пяти комплектациях по цене от 18 000 до 23 300 долларов. За первые 24 часа после запуска автомобиль собрал 16 368 оплаченных заказов. Фото Great Wall Motor Среднеразмерный кроссовер с габаритами 4780×1895×1725 мм и...