- Отечественные «Гонцы» стабильно передают... (550)
- YouTube запустил нейродубляж: доступно 27... (906)
- Galaxy S26 Ultra показал возможности до... (765)
- Магнитные камеры/объективы для смартфонов... (832)
- Никита Буянов опроверг связь загадочной Cor3... (650)
- Новый Li Auto L9 вышел на мороз: флагман... (823)
- «Атоммаш» разгоняется: новые заказы АЭС... (806)
- Starlink пришёл в... (872)
- ИИ помог и навредил: Arm стала больше... (631)
- Arm разочаровала инвесторов снижением... (633)
- Землю накрыла планетарная магнитная... (840)
- На УАЗе запустили Центр робототехники: завод... (862)
- Аккумулятор 10 000 мАч, Dimensity 7400... (829)
- 7000 мАч, 200 Мп и Snapdragon 8 Elite Gen 5... (778)
- Лунный реактор Rolls-Royce... (853)
- TSMC наладит выпуск 3-нм чипов в Японии —... (720)
Яндекс разрабатывает мультимодальную нейросеть SpeechGPT
Дата: 2024-06-03 20:23
Яндекс разрабатывает новую нейросеть под названием SpeechGPT и набирает для этого специалистов в области машинного обучения. На эту информацию в разделе вакансий компании обратило внимание издание «Коммерсантъ». Нейросеть SpeechGPT будет мультимодальной – способной обрабатывать разные виды вводных данных. Она должна уметь воспринимать текст и звук, отвечать текстом и звуком, решать разные задачи на стыке текста и звука, указано в описании.
Изображение: Freepik Некоторые сервисы Яндекса уже понимают вводные данные разных видов. Например, с ассистентом «Алиса» можно общаться как голосом, так и текстом, а возможность обрабатывать одновременно текст и картинки есть в сервисе «Нейро». Но между мультимодальным пользовательским опытом и мультимодальностью самой нейросети есть разница, считают эксперты: в первом случае данные переводятся из одного вида в другой.
Так, голосовой ассистент сначала преобразовывает речь в текст, затем его анализирует другая нейросеть, а уже третья превращает ответ обратно из текста в речь. Причём на каждом из этих шагов данные упрощаются. Мультимодальные модели учитывают контент разных типов без задержек и призваны улавливать эмоции, которые теряются при конвертации; так работает, к примеру, GPT-4o от OpenAI.
Аналитики полагают, что MVP-версия (минимально жизнеспособный продукт) SpeechGPT может появиться в ближайшие месяцы, а затем будет дорабатываться. Скорее всего, SpeechGPT будет встраиваться в уже существующие сервисы – будет происходить постепенная замена текущих нейросетевых моделей на более современные.
Подробнее на iXBT
Предыдущие новости
AMD приходится сравнивать монструозные 128-ядерные CPU Epyc с 64-ядерными Intel, потому что большего вторая не предлагает. Представлены Epyc поколения Turin
За анонсом новых настольных процессоров Ryzen 9000 и мобильных Ryzen AI 300 незаметно прошел анонс новых серверных CPU Epyc поколения Turin. А они выделяются как минимум количеством ядер. Анонс пока предварительный, но процессоры выйдут во втором полугодии. Новое поколение будет разделено на две линейки: на основе ядер Zen 5 и на основе Zen 5C. При этом название линейки,...
Дуров анонсировал масштабное секретное обновление Telegram на этой неделе
Основатель Telegram Павел Дуров анонсировал масштабное обновление Telegram, подробностей о котором пока что нет. На прошлой неделе мы получили еще одно большое обновление Telegram, которое включает в себя эффекты сообщений, подписи над фотографиями, поиск по хэштегам, свертываемые цитаты, действия для номеров телефонов в сообщениях и так далее. Павел Дуров Он также рассказал...
Социальная сеть X (ранее Twitter) официально разрешила публикацию порно и прочих материалов сексуального характера
Социальная сеть X (бывший Twitter) обновила свои правила, и теперь пользователям фактически разрешено публиковать порнографические материалы. Если точнее, разрешено делиться созданными и распространяемыми по обоюдному согласию изображениями наготы или сексуального поведения взрослых. Само собой, такой контент должен быть помечен соответствующим образом. Также подобные...
Sony анонсировала адаптер для подключения PlayStation VR2 к ПК — продажи начнутся в августе за $60
Меньше недели прошло с момента появления слухов о разработке Sony адаптера, поддерживающего подключение к ПК гарнитуры виртуальной реальности PlayStation VR2, и теперь компания официально сообщила о цене устройства и дате начала его продаж. Адаптер поступит в продажу 7 августа за $59,99. Источник изображения:...