- Мобильные аккумуляторы Xiaomi, Baseus,... (15)
- Фитнес-браслет Xiaomi Smart Band 10 поступил... (39)
- КамАЗ, Газпром и НАМИ объединятся, чтобы... (37)
- Без России — никак. В РФ создали... (41)
- Новая «Волга» по цене нового Mercedes-Benz... (43)
- В очаровательном приключении The Plucky... (40)
- МТС назвала самые популярные смартфоны среди... (32)
- Минцифры России выпустило приложение для... (38)
- В США начали строить горизонтальный... (39)
- Марсоход Curiosity запечатлел первые... (38)
- Яндекс представил первые портативные колонки... (40)
- DeepSeek упёрся в санкции: разработка модели... (44)
- Машинокомплекты для российского Hyundai... (43)
- Как освободить рабочее пространство: лучшие... (49)
- Искусственный интеллект внедрили в YouTube:... (60)
- Google DeepMind обучила ИИ читать ДНК... (45)
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинок, умеет решать головоломки и может стать основой для полноценного ИИ
Дата: 2023-03-03 23:57
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это позволит создать «общий искусственный интеллект» (AGI), который сможет решать ряд задач не хуже человека.

Этот ИИ называется мультимодальным (точнее, это мультимодальная большая языковая модель или MLLM) и, как полагают некоторые специалисты, он может стать основой для «общего искусственного интеллекта» — технологии, которая позволит ИИ заменить людей в решении интеллектуальных задач. Таким образом, это будет альтернативой чат-ботам и большим языковым моделям (LLM), которые стали популярны в последнее время. Отметим, что компания OpenAI, которая является одним из ключевых партнёров Microsoft в области ИИ, уже заявила, что хочет создать AGI и даже разработала меры безопасности для него.



Что касается Kosmos-1, то эта система, похоже, создана без участия OpenAI. Она работает в первую очередь с текстом, а изображения воспринимает как серию специальных токенов.
Microsoft обучила Kosmos-1 с использованием данных из Интернета 1 речь идёт о более чем 800 ГБ текста на английском языке. Как утверждается, новая система обогнала современные языковые модели. Однако пока остаётся верить Microsoft на слово — исходники компания ещё не опубликовала.
Подробнее на iXBT
Предыдущие новости
Пользователи научили чат-бота Bing от Microsoft рисовать котиков и снеговиков с помощью ASCII. Изначально там не было такой функции
ИИ-система Bing от Microsoft продолжает совершенствоваться. Она уже куда лучше отвечает на запросы пользователей, но при этом у неё появилась функция, которую разработчики не закладывали в чат-бота изначально. Сообщается, что ИИ начал генерировать ASCII-изображения в ответ на некоторые запросы. Пользователи уже опубликовали скриншоты того, что именно показывает нейросеть. Как...
Новая статья: Pharaoh: A New Era — эпоха заката. Рецензия
Тренд на обновление классических проектов и не думает сбавлять обороты — настал черёд градостроительной стратегии Pharaoh. Игра радовала поклонников тонкого социального менеджмента в древнеегипетском антураже аж с 1999-го года, так почему бы её не освежить некоторыми улучшениями? Насколько они оказались удачными — вопрос, на который мы постараемся ответить в нашей...
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинками, умеет решать головоломки и может стать основой для полноценного ИИ
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это...
Samsung продала в разы больше, чем все остальные вместе взятые. Аналитики Canalys подвели итоги рынка складных смартфонов в 2022 году
Согласно данным аналитиков Canalys, на которые ссылается SamMobile, компания Samsung продолжает доминировать на рынке складных смартфонов. За прошлый год корейский гигант продал чуть менее 12 млн таких аппаратов, и это при том, что весь рынок оценили в 14,2 млн. То есть Samsung продала в разы больше таких смартфонов, чем все остальные производители вместе взятые. Компания...