- Илон Маск рассматривает возможность... (1234)
- DDR5 на китайских чипах рвётся на рынок —... (1422)
- Larian объяснила, почему восьмой патч для... (1156)
- Генконструктор РКК «Энергия»: первый модуль... (1340)
- Видеокарты и процессоры резко подорожают в... (1187)
- Microsoft опять поломала Windows 11 — у... (1153)
- Аналог Li L7 с адаптивной подвеской и... (1257)
- Российское телеком-оборудование подорожало... (1278)
- Electronic Arts заинтриговала фанатов... (1081)
- Exeed ощутимо снизил цены на популярные... (1187)
- Microsoft вступила в гонку за покупку... (1099)
- Смартфон, который не боится падений, со... (1117)
- Гоночная Lada Iskra со 173-сильным мотором... (1073)
- «Надеемся завершить к 2030 году», — в России... (1030)
- «Автотор» намеревается и дальше выпускать... (1178)
- Так выглядит Lada Iskra SW: опубликовано... (1430)
Яндекс разрабатывает мультимодальную нейросеть SpeechGPT
Дата: 2024-06-03 20:23
Яндекс разрабатывает новую нейросеть под названием SpeechGPT и набирает для этого специалистов в области машинного обучения. На эту информацию в разделе вакансий компании обратило внимание издание «Коммерсантъ». Нейросеть SpeechGPT будет мультимодальной – способной обрабатывать разные виды вводных данных. Она должна уметь воспринимать текст и звук, отвечать текстом и звуком, решать разные задачи на стыке текста и звука, указано в описании.
![](https://www.ixbt.com/img//x780/n1/news/2024/5/1/futuristic-hand_large.jpg)
Некоторые сервисы Яндекса уже понимают вводные данные разных видов. Например, с ассистентом «Алиса» можно общаться как голосом, так и текстом, а возможность обрабатывать одновременно текст и картинки есть в сервисе «Нейро». Но между мультимодальным пользовательским опытом и мультимодальностью самой нейросети есть разница, считают эксперты: в первом случае данные переводятся из одного вида в другой.
Так, голосовой ассистент сначала преобразовывает речь в текст, затем его анализирует другая нейросеть, а уже третья превращает ответ обратно из текста в речь. Причём на каждом из этих шагов данные упрощаются. Мультимодальные модели учитывают контент разных типов без задержек и призваны улавливать эмоции, которые теряются при конвертации; так работает, к примеру, GPT-4o от OpenAI.
Аналитики полагают, что MVP-версия (минимально жизнеспособный продукт) SpeechGPT может появиться в ближайшие месяцы, а затем будет дорабатываться. Скорее всего, SpeechGPT будет встраиваться в уже существующие сервисы – будет происходить постепенная замена текущих нейросетевых моделей на более современные.
Подробнее на iXBT
Предыдущие новости
AMD приходится сравнивать монструозные 128-ядерные CPU Epyc с 64-ядерными Intel, потому что большего вторая не предлагает. Представлены Epyc поколения Turin
За анонсом новых настольных процессоров Ryzen 9000 и мобильных Ryzen AI 300 незаметно прошел анонс новых серверных CPU Epyc поколения Turin. А они выделяются как минимум количеством ядер. Анонс пока предварительный, но процессоры выйдут во втором полугодии. Новое поколение будет разделено на две линейки: на основе ядер Zen 5 и на основе Zen 5C. При этом название линейки,...
Дуров анонсировал масштабное секретное обновление Telegram на этой неделе
Основатель Telegram Павел Дуров анонсировал масштабное обновление Telegram, подробностей о котором пока что нет. На прошлой неделе мы получили еще одно большое обновление Telegram, которое включает в себя эффекты сообщений, подписи над фотографиями, поиск по хэштегам, свертываемые цитаты, действия для номеров телефонов в сообщениях и так далее. Павел Дуров Он также рассказал...
Социальная сеть X (ранее Twitter) официально разрешила публикацию порно и прочих материалов сексуального характера
Социальная сеть X (бывший Twitter) обновила свои правила, и теперь пользователям фактически разрешено публиковать порнографические материалы. Если точнее, разрешено делиться созданными и распространяемыми по обоюдному согласию изображениями наготы или сексуального поведения взрослых. Само собой, такой контент должен быть помечен соответствующим образом. Также подобные...
Sony анонсировала адаптер для подключения PlayStation VR2 к ПК — продажи начнутся в августе за $60
Меньше недели прошло с момента появления слухов о разработке Sony адаптера, поддерживающего подключение к ПК гарнитуры виртуальной реальности PlayStation VR2, и теперь компания официально сообщила о цене устройства и дате начала его продаж. Адаптер поступит в продажу 7 августа за $59,99. Источник изображения:...