- Как китайские компании получают доступ к... (1550)
- Средняя цена продажи смартфонов и ПК в 2026... (1981)
- Новые восьмиядерные Core Ultra 5 335 и 325... (2071)
- Хватает ли 8 ГБ памяти у видеокарты в конце... (2221)
- NASA переоборудовало «Астрован II» компании... (1420)
- Toyota RAV4 существенно подорожал в России.... (1813)
- Очень редкая видеокарта Asus ROG Matrix RTX... (1812)
- Пожароопасный разъём 12V-2x6 на системной... (2108)
- Очень быстрый монитор для киберспортсменов,... (1556)
- Эра дешевых смартфонов закончилась? В Honor... (1431)
- Больше никаких зеленых прямоугольников... (1456)
- Запрет AMD искусственный? Энтузиасту удалось... (1777)
- На ступень выше Honor Magic 8 Pro: Honor... (1402)
- Геймерам пора прощаться с 32-битной Windows.... (1525)
- Шестой год подряд Samsung выпускает Galaxy... (1347)
- Как Toyota Corolla, только без экспериментов... (1389)
Цифровые ископаемые: как опечатка 1959 года стала кошмаром для GPT-4o и научных журналов
Дата: 2025-04-19 08:49
«Вегетативная электронная микроскопия» — этот наукообразный, но абсолютно бессмысленный термин — как цифровое проклятие кочует по научным статьям, ответам нейросетей и даже рецензируемым журналам. Учёные раскрыли цепь событий, из-за которых опечатка 70-летней давности стала глобальной проблемой, угрожающей достоверности исследований.
Всё началось с технической ошибки при оцифровке статей 1959 года о бактериях. Программа для сканирования спутала колонки текста, склеив слова «вегетативный» и «электронный» в абсурдный гибрид. Этот артефакт, названный «цифровым ископаемым», десятилетиями сохранялся в данных, пока современные нейросети не начали массово его воспроизводить. Когда исследователи проверили модели вроде GPT-4o и Claude 3.5, те уверенно вставляли бессмыслицу в тексты, принимая её за реальный термин. При этом старые версии — GPT-2 или BERT — такой ошибки не допускали, что помогло установить момент «заражения» данных.
Вегетативная электронная микроскопия по версии нейросети Leonardo Ошибка оказалась цепкой из-за двух факторов. Во-первых, гигантские хранилища вроде CommonCrawl, откуда нейросети берут информацию, содержат петабайты данных — вручную исправить всё невозможно. Во-вторых, человеческие оплошности усилили проблему. Например, в иранских исследованиях термин, возможно, возник из-за опечатки при переводе с фарси: слова «вегетативный» и «сканирующий» отличаются всего одной точкой в персидской письменности. Нейросети затем растиражировали эту ошибку, сделав её частью «научного ландшафта».
Издатели усугубляют ситуацию. Elsevier сначала пытался оправдать термин, а журнал Frontier в прошлом году отозвал статью с AI-сгенерированными изображениями гениталий крыс — ещё один пример последствий бездумного использования технологий. Учёные из Гарварда также отмечают рост «мусорной науки» в Google Scholar, где поисковик вылавливает псевдонаучные материалы.
Ситуация раскрывает системную уязвимость: чем больше ИИ анализирует данные, тем выше риск, что ошибки станут восприниматься как истина. Исправить это в глобальном масштабе почти невозможно — остаётся полагаться на улучшение фильтрации данных и ответственность разработчиков. Однако пока «цифровые ископаемые» остаются в недрах интернета, они будут периодически всплывать, подрывая доверие к технологиям, которые призваны укреплять научный прогресс.
Подробнее на iXBT
Предыдущие новости
Единственный флагман без вырезов и отверстий, с IP68, крошечной рамкой и топовой 35-мм камерой. Представлен Nubia Z70S Ultra Photographer Edition
Nubia официально объявила о запуске Z70S Ultra Photographer Edition, запланированном на 28 апреля. Компания раскрыла дизайн устройства, которое получило топовую камеру и безрамочный экран, не имеющий вырезов. Устройство будет запущено вместе с загадочным продуктом на презентации Nubia AI Dual Flagship New Product Launch. Фото Nubia Задняя конструкция разделяет основную и...
Ученые разрабатывают компактные ускорители частиц с Wakefield-ускорением, сокращающие размер коллайдеров на 99%
Международная команда исследователей работает над созданием радикально уменьшенных и более дешевых ускорителей частиц, применяя технику Wakefield-ускорения, изучавшуюся с 1970-х годов. Технология использует плазменные волны, создаваемые лазером или пучком частиц, и позволяет ускорять электроны до высоких энергий в десятки раз быстрее, чем традиционные методы, применяемые в...
Кроме SpaceX, так не может никто в мире: компания запустит три абсолютно разные миссии за два дня
Компания SpaceX планирует с 20 по 21 апреля 2025 запустить три важные миссии при помощи ракет Falcon 9. Сначала будет запущена пятая в этом году миссия для Национального управления военно-космической разведки США (NRO), которая стартует в воскресенье, 20 апреля. Ранее NRO запустило девятую миссию по поддержке своей спутниковой группировки Starshield с расширенной архитектурой....
Совершенно новый Haval F7 с расходом менее 1 л на 100 км, который ждут в России, уже стал хитом: всего за сутки продано более 16 000 машин
Компания Great Wall Motor представила гибридный внедорожник Haval F7 (Haval Xiaolong Max) второго поколения на этой неделе, подтвердив, что новинка доступна в пяти комплектациях по цене от 18 000 до 23 300 долларов. За первые 24 часа после запуска автомобиль собрал 16 368 оплаченных заказов. Фото Great Wall Motor Среднеразмерный кроссовер с габаритами 4780×1895×1725 мм и...