- Человекоподобный робот UBTech Walker S2... (4634)
- Топ-менеджеры производителей электроники... (4045)
- Формату Blu-ray стукнуло 20 лет. Он... (3967)
- Samsung показала огромный и самый яркий в... (4040)
- Windows XP, Windows Vista, Windows 7,... (4151)
- «Ситуация беспрецедентна»: глава Samsung... (4013)
- Выглядит, как VHS-кассета и виниловый... (3172)
- Новая версия One UI 8.5 вышла для Samsung... (3105)
- «Samsung вернулась». Клиенты компании... (3560)
- Мультяшный WALL-E стал реальностью —... (4012)
- Представлен самый тонкий в мире... (4177)
- LG показала робота-дворецкого CLOiD — он... (3961)
- «Удлинить» сигнал HDMI на 40 метров без... (3219)
- Kia продала в 2025 году рекордные 3,13 млн... (3545)
- LG создала 16-дюймовый ноутбук легче MacBook... (3818)
- Из-за бездействия Valve фанатский ремейк... (4177)
Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ
Дата: 2021-03-29 13:46
Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными. Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных.
Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок — отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.
Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.
Остается добавить, что некоторые ошибки можно считать незначительными, а порой следует скорее говорить о неоднозначности входных данных. Тем не менее, в одном из наборов данных — тесте QuickDraw — ошибки есть примерно в 10% набора. Чему может научиться ИИ на таких данных — остается только догадываться.
Подробнее на iXBT
Предыдущие новости
Sony лидирует на рынке беззеркальных фотокамер, а Canon — зеркальных
Исследовательская компания Techno System Research обнародовала статистику по мировому рынку фотокамер со сменной оптикой: в рассмотрение берутся беззеркальные и зеркальные модели. В прошлом году, по оценкам, в глобальном масштабе было реализовано в общей сложности 5,65 млн устройств указанных типов. Среди них 3,26 млн составили беззеркальные модели, ещё 2,39 млн —...
Google выпустит камеру видеонаблюдения Nest Cam для умного дома нового поколения
Сегодня в базе данных FCC было обнаружено ещё не анонсированное устройство от компании Google. Как передаёт 9to5Google это может быть новая камера для видеонаблюдения. В документах гаджет фигурирует под названием «беспроводное устройство с потоковым вещанием». Ранее подобные описания не встречались у других устройств компании. Источник изображения:...
Производители литиевых аккумуляторов смогут рассчитывать на субсидии властей США
Сейчас американский рынок стоит на пороге реализации нескольких инициатив, направленных на решение ключевых проблем с дефицитом полупроводниковых компонентов и перевод автопарка на электротягу. Локализация производства тяговых аккумуляторов является одним из залогов успеха, и здесь власти страны наверняка решатся на субсидирование строительства предприятий в США. Источник...
Смарт-часы Amazfit можно будет купить со скидкой с 29 марта
Бренд Amazfit объявил о предстоящей акции, участники которой смогут купить со значительной скидкой смарт-часы Amazfit GTS 2 mini. Акция пройдёт с 29 марта по 3 апреля в официальном магазине Amazfit на интернет-площадке Tmall в рамках «Распродажи 328», посвящённой дню рождения AliExpress. Смарт-часы Amazfit GTS 2 mini в тонком изящном корпусе отличаются привлекательным...