- Samsung намерена воспользоваться... (848)
- Астронавты NASA будут снимать Луну на... (785)
- Китайские умельцы создали для 96-ядерного... (551)
- Возвращение бестселлера Geely в Россию:... (583)
- iGPU Intel Arc B390 под Linux выглядит уже... (751)
- Хотите новые процессоры — подождите полгода.... (755)
- Мышка с ценой более 1300 долларов.... (572)
- 9000 мАч при не самом большом экране.... (643)
- Apple представит 19 февраля недорогой iPhone... (774)
- SpaceX разрешили запускать Starship из... (479)
- SpaceX разрешили запускать Starhip из... (657)
- Google Meet получил голосовой перевод в... (625)
- Градостроительная стратегия Timberborn... (521)
- Razer выпустила Boomslang 20th Anniversary... (591)
- Четвёрка американских бигтехов зальёт ИИ... (530)
- В магазин без пенсионного: через мессенджер... (657)
Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ
Дата: 2021-03-29 13:46
Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными. Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных.
Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок — отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.
Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.
Остается добавить, что некоторые ошибки можно считать незначительными, а порой следует скорее говорить о неоднозначности входных данных. Тем не менее, в одном из наборов данных — тесте QuickDraw — ошибки есть примерно в 10% набора. Чему может научиться ИИ на таких данных — остается только догадываться.
Подробнее на iXBT
Предыдущие новости
Sony лидирует на рынке беззеркальных фотокамер, а Canon — зеркальных
Исследовательская компания Techno System Research обнародовала статистику по мировому рынку фотокамер со сменной оптикой: в рассмотрение берутся беззеркальные и зеркальные модели. В прошлом году, по оценкам, в глобальном масштабе было реализовано в общей сложности 5,65 млн устройств указанных типов. Среди них 3,26 млн составили беззеркальные модели, ещё 2,39 млн —...
Google выпустит камеру видеонаблюдения Nest Cam для умного дома нового поколения
Сегодня в базе данных FCC было обнаружено ещё не анонсированное устройство от компании Google. Как передаёт 9to5Google это может быть новая камера для видеонаблюдения. В документах гаджет фигурирует под названием «беспроводное устройство с потоковым вещанием». Ранее подобные описания не встречались у других устройств компании. Источник изображения:...
Производители литиевых аккумуляторов смогут рассчитывать на субсидии властей США
Сейчас американский рынок стоит на пороге реализации нескольких инициатив, направленных на решение ключевых проблем с дефицитом полупроводниковых компонентов и перевод автопарка на электротягу. Локализация производства тяговых аккумуляторов является одним из залогов успеха, и здесь власти страны наверняка решатся на субсидирование строительства предприятий в США. Источник...
Смарт-часы Amazfit можно будет купить со скидкой с 29 марта
Бренд Amazfit объявил о предстоящей акции, участники которой смогут купить со значительной скидкой смарт-часы Amazfit GTS 2 mini. Акция пройдёт с 29 марта по 3 апреля в официальном магазине Amazfit на интернет-площадке Tmall в рамках «Распродажи 328», посвящённой дню рождения AliExpress. Смарт-часы Amazfit GTS 2 mini в тонком изящном корпусе отличаются привлекательным...