- «Москвич-412» продают за баснословные 20 млн... (648)
- Xiaomi собралась поставить 550 000... (617)
- AMD показала свой мини-суперкомпьютер,... (668)
- Первый ПК с Ryzen 7 9850X3D. Alienware... (680)
- Ранняя Вселенная оказалась горячее, чем... (690)
- 120 Гц, 6200 мАч с SuperVOOC 80 Вт, 200 Мп с... (605)
- Пол-литровый ПК с новейшим Intel внутри. MSI... (608)
- Клавиатура с 64 ГБ оперативной памяти DDR5 и... (637)
- Представлен второй электромобиль Sony — а... (572)
- В атмосфере Бетельгейзе обнаружен след... (577)
- Перископная камера на 50 Мп,... (664)
- Апгрейд откладывается? Nvidia представила... (628)
- 13-дюймовый экран, кнопка GoPro и чудовищный... (570)
- Новый флагманский смартфон получит основную... (594)
- Мониторы с Nvidia G-Sync Pulsar наконец-то... (563)
- Роботакси на технологиях Nvidia появятся в... (672)
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинок, умеет решать головоломки и может стать основой для полноценного ИИ
Дата: 2023-03-03 23:57
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это позволит создать «общий искусственный интеллект» (AGI), который сможет решать ряд задач не хуже человека.
Сгенерировано нейросетью Midjourney Этот ИИ называется мультимодальным (точнее, это мультимодальная большая языковая модель или MLLM) и, как полагают некоторые специалисты, он может стать основой для «общего искусственного интеллекта» — технологии, которая позволит ИИ заменить людей в решении интеллектуальных задач. Таким образом, это будет альтернативой чат-ботам и большим языковым моделям (LLM), которые стали популярны в последнее время. Отметим, что компания OpenAI, которая является одним из ключевых партнёров Microsoft в области ИИ, уже заявила, что хочет создать AGI и даже разработала меры безопасности для него.
Что касается Kosmos-1, то эта система, похоже, создана без участия OpenAI. Она работает в первую очередь с текстом, а изображения воспринимает как серию специальных токенов.
Microsoft обучила Kosmos-1 с использованием данных из Интернета 1 речь идёт о более чем 800 ГБ текста на английском языке. Как утверждается, новая система обогнала современные языковые модели. Однако пока остаётся верить Microsoft на слово — исходники компания ещё не опубликовала.
Подробнее на iXBT
Предыдущие новости
Пользователи научили чат-бота Bing от Microsoft рисовать котиков и снеговиков с помощью ASCII. Изначально там не было такой функции
ИИ-система Bing от Microsoft продолжает совершенствоваться. Она уже куда лучше отвечает на запросы пользователей, но при этом у неё появилась функция, которую разработчики не закладывали в чат-бота изначально. Сообщается, что ИИ начал генерировать ASCII-изображения в ответ на некоторые запросы. Пользователи уже опубликовали скриншоты того, что именно показывает нейросеть. Как...
Новая статья: Pharaoh: A New Era — эпоха заката. Рецензия
Тренд на обновление классических проектов и не думает сбавлять обороты — настал черёд градостроительной стратегии Pharaoh. Игра радовала поклонников тонкого социального менеджмента в древнеегипетском антураже аж с 1999-го года, так почему бы её не освежить некоторыми улучшениями? Насколько они оказались удачными — вопрос, на который мы постараемся ответить в нашей...
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинками, умеет решать головоломки и может стать основой для полноценного ИИ
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это...
Samsung продала в разы больше, чем все остальные вместе взятые. Аналитики Canalys подвели итоги рынка складных смартфонов в 2022 году
Согласно данным аналитиков Canalys, на которые ссылается SamMobile, компания Samsung продолжает доминировать на рынке складных смартфонов. За прошлый год корейский гигант продал чуть менее 12 млн таких аппаратов, и это при том, что весь рынок оценили в 14,2 млн. То есть Samsung продала в разы больше таких смартфонов, чем все остальные производители вместе взятые. Компания...