- 4-дюймовый экран, камера, искусственный... (3321)
- OnePlus представила смартфоны Turbo 6 и... (3115)
- AMD не ожидает дефицита видеокарт Radeon в... (3112)
- В России до конца 2026 года продлён... (3872)
- «Sea of Thieves, но в пустыне»: трейлер... (2991)
- ЧП на МКС: NASA решило досрочно вернуть... (3193)
- ИИ Илона Маска больше не раздевает людей и... (5404)
- Очень большой и невероятно дешёвый... (3319)
- Финишная прямая: NASA готовится к выкату... (4153)
- Тут расположен самый мощный (около 2 ГВт)... (3225)
- Свои ракеты, свои правила и свой шериф? В... (3830)
- 15 000 аппаратов и доступ к Интернету со... (3506)
- Офисные профессии исчезнут первыми: Маск... (3284)
- Уникальное в этом столетии зрелище:... (3799)
- Такого с Samsung не было очень давно:... (3328)
- Многие производители смартфонов готовятся... (4985)
Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ
Дата: 2021-03-29 13:46
Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными. Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных.
Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок — отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.
Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.
Остается добавить, что некоторые ошибки можно считать незначительными, а порой следует скорее говорить о неоднозначности входных данных. Тем не менее, в одном из наборов данных — тесте QuickDraw — ошибки есть примерно в 10% набора. Чему может научиться ИИ на таких данных — остается только догадываться.
Подробнее на iXBT
Предыдущие новости
Sony лидирует на рынке беззеркальных фотокамер, а Canon — зеркальных
Исследовательская компания Techno System Research обнародовала статистику по мировому рынку фотокамер со сменной оптикой: в рассмотрение берутся беззеркальные и зеркальные модели. В прошлом году, по оценкам, в глобальном масштабе было реализовано в общей сложности 5,65 млн устройств указанных типов. Среди них 3,26 млн составили беззеркальные модели, ещё 2,39 млн —...
Google выпустит камеру видеонаблюдения Nest Cam для умного дома нового поколения
Сегодня в базе данных FCC было обнаружено ещё не анонсированное устройство от компании Google. Как передаёт 9to5Google это может быть новая камера для видеонаблюдения. В документах гаджет фигурирует под названием «беспроводное устройство с потоковым вещанием». Ранее подобные описания не встречались у других устройств компании. Источник изображения:...
Производители литиевых аккумуляторов смогут рассчитывать на субсидии властей США
Сейчас американский рынок стоит на пороге реализации нескольких инициатив, направленных на решение ключевых проблем с дефицитом полупроводниковых компонентов и перевод автопарка на электротягу. Локализация производства тяговых аккумуляторов является одним из залогов успеха, и здесь власти страны наверняка решатся на субсидирование строительства предприятий в США. Источник...
Смарт-часы Amazfit можно будет купить со скидкой с 29 марта
Бренд Amazfit объявил о предстоящей акции, участники которой смогут купить со значительной скидкой смарт-часы Amazfit GTS 2 mini. Акция пройдёт с 29 марта по 3 апреля в официальном магазине Amazfit на интернет-площадке Tmall в рамках «Распродажи 328», посвящённой дню рождения AliExpress. Смарт-часы Amazfit GTS 2 mini в тонком изящном корпусе отличаются привлекательным...