- Realme возвращается в (1415)
- Это как умная колонка, только с... (1190)
- Дженсен Хуанг обвалил акции производителей... (901)
- У каждой клавиши свой экран, а рядом экран... (1240)
- Motorola представила свой первый... (1426)
- Представлен панорамный корпус Asus ROG... (951)
- Летающий мотоцикл Leo Flight впервые... (1325)
- Теперь Raspberry Pi 5 стоят как самые... (932)
- Razer начала выпускать рабочие станции для... (1264)
- На Камчатке больше недели не работает... (1454)
- Апскейлер DLSS 4.5 ориентирован на режимы с... (957)
- Поясница скажет спасибо. Представлено первое... (1312)
- Учёные впервые увидели самую далёкую... (886)
- Связка из Ryzen 9955HX3D и RTX 5090 Laptop.... (1341)
- Дорога от Москвы до Валдая займет час.... (1256)
- SSD с PCIe 5.0 становятся массовыми:... (1026)
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинок, умеет решать головоломки и может стать основой для полноценного ИИ
Дата: 2023-03-03 23:57
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это позволит создать «общий искусственный интеллект» (AGI), который сможет решать ряд задач не хуже человека.
Сгенерировано нейросетью Midjourney Этот ИИ называется мультимодальным (точнее, это мультимодальная большая языковая модель или MLLM) и, как полагают некоторые специалисты, он может стать основой для «общего искусственного интеллекта» — технологии, которая позволит ИИ заменить людей в решении интеллектуальных задач. Таким образом, это будет альтернативой чат-ботам и большим языковым моделям (LLM), которые стали популярны в последнее время. Отметим, что компания OpenAI, которая является одним из ключевых партнёров Microsoft в области ИИ, уже заявила, что хочет создать AGI и даже разработала меры безопасности для него.
Что касается Kosmos-1, то эта система, похоже, создана без участия OpenAI. Она работает в первую очередь с текстом, а изображения воспринимает как серию специальных токенов.
Microsoft обучила Kosmos-1 с использованием данных из Интернета 1 речь идёт о более чем 800 ГБ текста на английском языке. Как утверждается, новая система обогнала современные языковые модели. Однако пока остаётся верить Microsoft на слово — исходники компания ещё не опубликовала.
Подробнее на iXBT
Предыдущие новости
Пользователи научили чат-бота Bing от Microsoft рисовать котиков и снеговиков с помощью ASCII. Изначально там не было такой функции
ИИ-система Bing от Microsoft продолжает совершенствоваться. Она уже куда лучше отвечает на запросы пользователей, но при этом у неё появилась функция, которую разработчики не закладывали в чат-бота изначально. Сообщается, что ИИ начал генерировать ASCII-изображения в ответ на некоторые запросы. Пользователи уже опубликовали скриншоты того, что именно показывает нейросеть. Как...
Новая статья: Pharaoh: A New Era — эпоха заката. Рецензия
Тренд на обновление классических проектов и не думает сбавлять обороты — настал черёд градостроительной стратегии Pharaoh. Игра радовала поклонников тонкого социального менеджмента в древнеегипетском антураже аж с 1999-го года, так почему бы её не освежить некоторыми улучшениями? Насколько они оказались удачными — вопрос, на который мы постараемся ответить в нашей...
Microsoft представила новый ИИ Kosmos-1. Он понимает текст с картинками, умеет решать головоломки и может стать основой для полноценного ИИ
На днях исследователи из Microsoft представили Kosmos-1, ИИ-модель, которая умеет анализировать изображения, находит на них текст и распознавать его, решать визуальные головоломки, проходить визуальные тесты IQ и воспринимать команды на естественном языке. Эта система, как утверждается, сможет объединить различные режимы ввода: текст, изображения, видео, звук и так далее. Это...
Samsung продала в разы больше, чем все остальные вместе взятые. Аналитики Canalys подвели итоги рынка складных смартфонов в 2022 году
Согласно данным аналитиков Canalys, на которые ссылается SamMobile, компания Samsung продолжает доминировать на рынке складных смартфонов. За прошлый год корейский гигант продал чуть менее 12 млн таких аппаратов, и это при том, что весь рынок оценили в 14,2 млн. То есть Samsung продала в разы больше таких смартфонов, чем все остальные производители вместе взятые. Компания...