- Tecno предварительно представила сверхтонкий... (19)
- Такого не было за всю историю российского... (21)
- Первая металлическая деталь, напечатанная на... (19)
- Замена Toyota RAV4 с официальной гарантией 5... (20)
- Экипаж миссии NASA SpaceX Crew-10 с... (22)
- Exeed LX стал намного дешевле для россиян:... (35)
- M**a уволила около 20 сотрудников за... (35)
- Дилеры рассказали, когда в России появится... (20)
- Российские дилеры ожидают Subaru Forester... (37)
- Infinix представила компактный... (35)
- M**a представила умные очки Aria Gen 2,... (35)
- Первый корпус реактора на АЭС «Эль-Дабаа»... (35)
- «МегаФон» и Yota отменили роуминг в Крыму и... (42)
- Новейший отечественный минивэн уровня Toyota... (39)
- Инди-разработчик привязал цену своей игры к... (33)
- Чат-бот M**a AI скоро получит отдельное... (34)
Яндекс разрабатывает мультимодальную нейросеть SpeechGPT
Дата: 2024-06-03 20:23
Яндекс разрабатывает новую нейросеть под названием SpeechGPT и набирает для этого специалистов в области машинного обучения. На эту информацию в разделе вакансий компании обратило внимание издание «Коммерсантъ». Нейросеть SpeechGPT будет мультимодальной – способной обрабатывать разные виды вводных данных. Она должна уметь воспринимать текст и звук, отвечать текстом и звуком, решать разные задачи на стыке текста и звука, указано в описании.

Некоторые сервисы Яндекса уже понимают вводные данные разных видов. Например, с ассистентом «Алиса» можно общаться как голосом, так и текстом, а возможность обрабатывать одновременно текст и картинки есть в сервисе «Нейро». Но между мультимодальным пользовательским опытом и мультимодальностью самой нейросети есть разница, считают эксперты: в первом случае данные переводятся из одного вида в другой.
Так, голосовой ассистент сначала преобразовывает речь в текст, затем его анализирует другая нейросеть, а уже третья превращает ответ обратно из текста в речь. Причём на каждом из этих шагов данные упрощаются. Мультимодальные модели учитывают контент разных типов без задержек и призваны улавливать эмоции, которые теряются при конвертации; так работает, к примеру, GPT-4o от OpenAI.
Аналитики полагают, что MVP-версия (минимально жизнеспособный продукт) SpeechGPT может появиться в ближайшие месяцы, а затем будет дорабатываться. Скорее всего, SpeechGPT будет встраиваться в уже существующие сервисы – будет происходить постепенная замена текущих нейросетевых моделей на более современные.
Подробнее на iXBT
Предыдущие новости
AMD приходится сравнивать монструозные 128-ядерные CPU Epyc с 64-ядерными Intel, потому что большего вторая не предлагает. Представлены Epyc поколения Turin
За анонсом новых настольных процессоров Ryzen 9000 и мобильных Ryzen AI 300 незаметно прошел анонс новых серверных CPU Epyc поколения Turin. А они выделяются как минимум количеством ядер. Анонс пока предварительный, но процессоры выйдут во втором полугодии. Новое поколение будет разделено на две линейки: на основе ядер Zen 5 и на основе Zen 5C. При этом название линейки,...
Дуров анонсировал масштабное секретное обновление Telegram на этой неделе
Основатель Telegram Павел Дуров анонсировал масштабное обновление Telegram, подробностей о котором пока что нет. На прошлой неделе мы получили еще одно большое обновление Telegram, которое включает в себя эффекты сообщений, подписи над фотографиями, поиск по хэштегам, свертываемые цитаты, действия для номеров телефонов в сообщениях и так далее. Павел Дуров Он также рассказал...
Социальная сеть X (ранее Twitter) официально разрешила публикацию порно и прочих материалов сексуального характера
Социальная сеть X (бывший Twitter) обновила свои правила, и теперь пользователям фактически разрешено публиковать порнографические материалы. Если точнее, разрешено делиться созданными и распространяемыми по обоюдному согласию изображениями наготы или сексуального поведения взрослых. Само собой, такой контент должен быть помечен соответствующим образом. Также подобные...
Sony анонсировала адаптер для подключения PlayStation VR2 к ПК — продажи начнутся в августе за $60
Меньше недели прошло с момента появления слухов о разработке Sony адаптера, поддерживающего подключение к ПК гарнитуры виртуальной реальности PlayStation VR2, и теперь компания официально сообщила о цене устройства и дате начала его продаж. Адаптер поступит в продажу 7 августа за $59,99. Источник изображения:...