- В России освоили корпусирование микросхем... (210)
- Bethesda подарила копии The Elder Scrolls... (177)
- Нашумевший ИИ-бот DeepSeek будет... (221)
- Представлен смартфон Huawei Enjoy 80 с... (251)
- Самый большой седан Chery получил 5-метровый... (165)
- «Пепелац» прибыл: какие части «Союзов»... (143)
- Какие части «Союзов» используют повторно и... (237)
- Учёные NASA провели масштабное исследование... (245)
- «Базис» представляет обновленный Basis... (180)
- Отечественная альтернатива Google Play: в... (179)
- Новейшая Hyundai Sonata 2025 с 6-ступенчатым... (211)
- Локализаторы Starfield перевели The Elder... (162)
- «Легендарное корейское качество» и гарантия... (217)
- Илон Маск пообещал уделять меньше внимания... (170)
- Grok научился «видеть» окружающий... (184)
- Метеориты - носители жизни? Ученые... (193)
Доступно даже на смартфонах: в Сбере научили легковесные модели ИИ распознавать эмоции в сложных условиях
Дата: 2025-04-23 17:34
Учёные лаборатории искусственного интеллекта Сбербанка предложили новый подход к распознаванию эмоций в реальных условиях. Специалисты показали, как комбинация визуальных, акустических и текстовых данных повышает точность эмоционального анализа на основе моделей искусственного интеллекта.

На практике системы распознавания эмоций часто сталкиваются с несколькими проблемами. Во-первых, это низкая точность в условиях изменяющегося освещения, ракурсов или фонового шума. Во-вторых, высокие вычислительные затраты современных алгоритмов, затрудняющие возможность обработки чувствительной персональной информации (видео лиц) на пользовательских устройствах. Наконец, для обучения моделей необходимы большие объёмы данных, при этом качественная разметка несколькими экспертами эмоций на видео обычно занимает много времени.
Решение исследователей Сбера основано на трёх ключевых аспектах. Эксперты предложили использовать обученные на открытых наборах фотографий эмоциональных лиц эффективные нейронные сети (EmotiEffNet, MobileViT, MobileFaceNet) для анализа мимики, что позволяет эффективно работать в режиме реального времени даже на обычных смартфонах. Кроме этого, для снижения нагрузки на систему и повышения точности проводится фильтрация кадров, эмоции на которых надёжно распознаются с помощью предобученных моделей. Также учёные доказали, что комбинирование данных из разных источников (текст, аудио, видео) с помощью метода «позднего слияния» (late fusion) ускоряет адаптацию модели к решению новых задач.
Результаты исследования представили в работе Leveraging Lightweight Facial Models and Textual Modality in Audio-visual Emotional Understanding in-the-Wild («Использование легковесных моделей анализа лица и текстовых модальностей в аудиовизуальном понимании эмоций в естественных условиях»). Её приняли к публикации на международной конференции CVPR. На восьмом международном конкурсе ABAW предложанный подход занял 1-е место в задачах распознавания выражений лица и амбивалентности (нерешительности) и 3-е место в оценке интенсивности эмоций и детектировании микровыражений (action units).
Подробнее на iXBT
Предыдущие новости
И компактный флагман, и монстр автономности. Раскрыты все характеристики OnePlus 13T: экран 6,32 дюйма, 6260 мАч, IP65 и Snapdragon 8 Elite
Официальная премьера нового флагмана OnePlus — OnePlus 13T — состоится завтра, но уже сегодня известный инсайдер Digital Chat Station раскрыл подробные характеристики устройства. Фото: OnePlus В плане габаритов и производительности OnePlus 13T выступит аналогом Samsung Galaxy S25: аппарат получит экран с диагональю 6,32 дюйма и разрешением 2460 x 1216 пикселей, в основе...
Экспериментальное электронное производство: «Калашников» открыл новую производственную площадку в Москве
В «Технополисе Москва» прошло открытие новой производственной площадки концерна «Калашников». По словам генерального директора концерна Алана Лушникова, «Калашников» разместит в новом комплексе экспериментальное электронное производство по выпуску комплектующих и элементов электронной компонентной базы. Иллюстрация: «Калашников» / mos.ru Здесь же обустроят экспериментальную...
Samsung уже готовит One UI 8.5 на Android 16 для Galaxy S26 — One UI 8.1 можно не ждать
Samsung очень медлила с выпуском финальной версии One UI 7.0 (чем расстроила многих пользователей Galaxy), One UI 8.0 ждем только к августу, но компания уже трудится над One UI 8.5 для будущей линейки Galaxy S26: упоминания интерфейса One UI 8.5 обнаружены в коде системного ПО Samsung. Это будет первый случай с 2020 года (после выхода One UI 2.5), когда Samsung использует...
Будущее космических технологий: Россия разрабатывает двигатели-электроспреи на ионной жидкости
Российские ученые из НИЯУ МИФИ совместно с компанией СТАР разрабатывают инновационные космические двигатели-электроспреи для наноспутников. Основа двигателей - принцип разгона заряженных частиц ионной жидкости. Это значительно повысит маневренность и срок службы малых космических аппаратов. Успешно завершенный аванпроект подтвердил потенциал технологии. Изображение...