- M**a запустит отдельное приложение для... (660)
- OpenAI представила GPT-5.3-Codex — ИИ-модель... (668)
- Дефицит добрался до процессоров: Intel и AMD... (682)
- Первая батарея, которая обеспечивает... (885)
- Цукерберг предложил поменьше изучать вред... (569)
- От спецслужб и страйкбола до аэродромов: в... (826)
- Представлена компьютерная мышь в виде... (743)
- Теперь придётся доплатить: Samsung... (728)
- В Китае представили жутковатого робота,... (554)
- Sony и другие японские бренды не выдерживают... (680)
- Toyota меняет (609)
- В России осталось 20 тысяч непроданных... (579)
- Позволяет заглянуть в процессы, недоступные... (548)
- Опубликованы одни из самых качественных... (578)
- В России начали принимать заказы на... (870)
- Без дефицитной HBM: Positron AI готовит... (837)
Специалисты MIT обнаружили ошибки в наборах данных, используемых для тестирования ИИ
Дата: 2021-03-29 13:46
Команда исследователей, возглавляемая специалистами из Массачусетского технологического института (MIT), изучила десять наборов данных, чаще всего используемых для тестирования систем машинного обучения. Ученые обнаружили, что около 3,4% данных были неточными или неправильно маркированными. Это могло вызвать проблемы в системах искусственного интеллекта, которые используют эти наборы данных.
Наборы данных, на каждый из которых есть ссылки более чем в 100 000 работ, включают текстовые материалы, изображения и видео из групп новостей, магазина Amazon, сервиса YouTube и базы фильмов IMDb. Среди ошибок — отрицательные отзывы о товарах, ошибочно помеченные как положительные, неверное описание того, что изображено на иллюстрациях, неточное описание содержания звукозаписей.
Показательно, что для обнаружения возможных ошибок исследователи тоже использовали методы машинного обучения и соответствующие программные инструменты.
Остается добавить, что некоторые ошибки можно считать незначительными, а порой следует скорее говорить о неоднозначности входных данных. Тем не менее, в одном из наборов данных — тесте QuickDraw — ошибки есть примерно в 10% набора. Чему может научиться ИИ на таких данных — остается только догадываться.
Подробнее на iXBT
Предыдущие новости
Sony лидирует на рынке беззеркальных фотокамер, а Canon — зеркальных
Исследовательская компания Techno System Research обнародовала статистику по мировому рынку фотокамер со сменной оптикой: в рассмотрение берутся беззеркальные и зеркальные модели. В прошлом году, по оценкам, в глобальном масштабе было реализовано в общей сложности 5,65 млн устройств указанных типов. Среди них 3,26 млн составили беззеркальные модели, ещё 2,39 млн —...
Google выпустит камеру видеонаблюдения Nest Cam для умного дома нового поколения
Сегодня в базе данных FCC было обнаружено ещё не анонсированное устройство от компании Google. Как передаёт 9to5Google это может быть новая камера для видеонаблюдения. В документах гаджет фигурирует под названием «беспроводное устройство с потоковым вещанием». Ранее подобные описания не встречались у других устройств компании. Источник изображения:...
Производители литиевых аккумуляторов смогут рассчитывать на субсидии властей США
Сейчас американский рынок стоит на пороге реализации нескольких инициатив, направленных на решение ключевых проблем с дефицитом полупроводниковых компонентов и перевод автопарка на электротягу. Локализация производства тяговых аккумуляторов является одним из залогов успеха, и здесь власти страны наверняка решатся на субсидирование строительства предприятий в США. Источник...
Смарт-часы Amazfit можно будет купить со скидкой с 29 марта
Бренд Amazfit объявил о предстоящей акции, участники которой смогут купить со значительной скидкой смарт-часы Amazfit GTS 2 mini. Акция пройдёт с 29 марта по 3 апреля в официальном магазине Amazfit на интернет-площадке Tmall в рамках «Распродажи 328», посвящённой дню рождения AliExpress. Смарт-часы Amazfit GTS 2 mini в тонком изящном корпусе отличаются привлекательным...