- Новые монстры автономности с экраном 165 Гц,... (439)
- Администрация Трампа угрожает европейским... (299)
- OpenAI выпустила генератор изображений... (445)
- Amazon рассматривает возможность инвестиций... (311)
- Суд требует запрета на выпуск и продажу... (603)
- M**a научила умные очки Ray-Ban и... (481)
- Похоже на смартфон, только очень толстый и с... (695)
- Oppo Find X9 Ultra получит ещё более... (612)
- Google запустила ИИ-агента, который избавит... (341)
- Valve открыла для пользователей Steam... (1432)
- Разработчик HDMI покажет прототип кабеля для... (394)
- С большим обновлением в эвакуационный шутер... (536)
- Minisforum выпустила Mini-ITX-плату для... (394)
- Поисковик Google получил ещё одну... (441)
- Глава Mozilla рассказал о приоритетах... (437)
- Colorful выпустила компактные видеокарты... (408)
Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
Дата: 2025-10-22 15:50
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз).
Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст.
Иллюстрация: Sora Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub.
Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов.
Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка.
Подробнее на iXBT
Предыдущие новости
Раньше на этом российском заводе выпускали Mitsubishi Outlander, а сейчас — Haval M6. Калужский завод «Автомобильные технологии» оформил ОТТС на китайский кроссовер
Ранее Haval M6 выпускали на российском предприятии Haval в Туле, а сейчас машину выпускают в Калуге на заводе «Автомобильные технологии» (бывший «ПСМА Рус», на котором выпускали автомобили Mitsubishi, Peugeot, Citroen и Opel — в том числе Mitsubishi Outlander). Как сообщает «Автопоток», «Автомобильные технологии» оформили новое Одобрение типа на Haval M6 — теперь изготовителем...
«Это радикальное изменение в работе космических систем». SpaceX открывает доступ к лазерной технологии Starlink сторонним компаниям, начиная с Muon Space
Компания Muon Space установит лазерные терминалы Starlink на свои спутники, чтобы обеспечить клиентам своей спутниковой группировки передачу данных в режиме, близком к реальному времени. Muon Space заявила, что это соглашение включат её спутники в глобальную цифровую инфраструктуру Starlink. Компания Muon Space проектирует и строит спутниковые группировки для своих клиентов...
В России — от 3,3 млн рублей, а в Китае всего 104 тыс. юаней (1,2 млн рублей). Great Wall Kingkong Poer 2026 вышел на рынок
Great Wall Motor вывела на домашний рынок пикап Kingkong Poer 2026. Машина оснащается 2,0-литровыми моторами — бензиновым и дизельным, а цены стартуют всего лишь от 89,8 тыс. юаней (1,05 млн рублей). В России самый доступный Kingkong Poer 2025 — с 2,0-литровым бензиновым мотором, «механикой» и полным приводом — стоит 3,3 млн рублей. В Китае аналогичный Kingkong Poer 2026...
На АвтоВАЗе и так проблем хватает: удлинённую Lada Niva Travel заморозили, возможно, навсегда
Инсайдер под ником KhaDm сообщил, что в сентябре на АвтоВАЗе прошло несколько закрытых совещаний, где руководство решало, как улучшать положение. Ситуация следующая: у дилеров до сих пор стоят непроданные Lada Aura 2024 года, электрический E-Largus ограничился партией из трёх-пяти машин, а Lada Iskra пока так и не вышла в полноценное серийное производство. Фото KhaDm Одним из...