- Xiaomi выпустила глобальную HyperOS 3.1 для... (11175)
- Apple не смогла разместить камеру под... (10487)
- Инсайдер показал, как может выглядеть iPhone... (11776)
- SpaceX запустила две ракеты за день. Илон... (12021)
- SpaceX готовит переброску ракет Starship из... (11657)
- Бум ИИ позволил Huawei достичь максимальной... (11235)
- Интернет как на земле, но без Starlink: одна... (10494)
- Новый Redmi K90 с Dimensity 9500 и зарядкой... (10743)
- Samsung Galaxy S26 Ultra и Vivo X300 Ultra... (10865)
- SQD Mini-LED, Dolby Vision, 288 Гц и звук... (12888)
- «Король телевизоров». В Европе выходит TCL... (11627)
- В отель без паспорта: россиянам разрешили... (11158)
- Без Max не купить: Ozon вводит двойную... (12267)
- Мини-ПК в форме шайбы объёмом 0,65 л. Lenovo... (12277)
- Смартфоны Realme C100 5G и C100i 4G и... (11716)
- SQD-Mini LED, 6000 нит, 288 Гц и звук Bang &... (10173)
Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ
Дата: 2021-03-29 13:46
Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными. Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных.
Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок — отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.
Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.
Остается добавить, что некоторые ошибки можно считать незначительными, а порой следует скорее говорить о неоднозначности входных данных. Тем не менее, в одном из наборов данных — тесте QuickDraw — ошибки есть примерно в 10% набора. Чему может научиться ИИ на таких данных — остается только догадываться.
Подробнее на iXBT
Предыдущие новости
Sony лидирует на рынке беззеркальных фотокамер, а Canon — зеркальных
Исследовательская компания Techno System Research обнародовала статистику по мировому рынку фотокамер со сменной оптикой: в рассмотрение берутся беззеркальные и зеркальные модели. В прошлом году, по оценкам, в глобальном масштабе было реализовано в общей сложности 5,65 млн устройств указанных типов. Среди них 3,26 млн составили беззеркальные модели, ещё 2,39 млн —...
Google выпустит камеру видеонаблюдения Nest Cam для умного дома нового поколения
Сегодня в базе данных FCC было обнаружено ещё не анонсированное устройство от компании Google. Как передаёт 9to5Google это может быть новая камера для видеонаблюдения. В документах гаджет фигурирует под названием «беспроводное устройство с потоковым вещанием». Ранее подобные описания не встречались у других устройств компании. Источник изображения:...
Производители литиевых аккумуляторов смогут рассчитывать на субсидии властей США
Сейчас американский рынок стоит на пороге реализации нескольких инициатив, направленных на решение ключевых проблем с дефицитом полупроводниковых компонентов и перевод автопарка на электротягу. Локализация производства тяговых аккумуляторов является одним из залогов успеха, и здесь власти страны наверняка решатся на субсидирование строительства предприятий в США. Источник...
Смарт-часы Amazfit можно будет купить со скидкой с 29 марта
Бренд Amazfit объявил о предстоящей акции, участники которой смогут купить со значительной скидкой смарт-часы Amazfit GTS 2 mini. Акция пройдёт с 29 марта по 3 апреля в официальном магазине Amazfit на интернет-площадке Tmall в рамках «Распродажи 328», посвящённой дню рождения AliExpress. Смарт-часы Amazfit GTS 2 mini в тонком изящном корпусе отличаются привлекательным...