- Сбой Cloudflare снова «положил» половину... (402)
- Cloudflare заблокировала 416 млрд запросов... (406)
- Куда столько: представлен 1000-герцевый... (674)
- Canon не выдержала конкуренции и закрыла... (385)
- Canon нет выдержала конкуренции и закрыла... (520)
- Автомобили Haval подорожали в... (387)
- Nvidia списала GeForce GTX 10 и GTX 900: для... (348)
- Представлена новая версия Motorola Edge... (490)
- Первый в мире на Snapdragon 8 Gen 5, с АКБ... (649)
- «Невероятно атмосферное приключение»:... (400)
- Скидки до 560 тыс. рублей: началась... (509)
- Новая студия создателя Just Cause... (529)
- «Москвич 5» появился у дилеров до... (630)
- Возмутивший фанатов кооперативный шутер... (409)
- После дебюта на бирже акции китайского... (540)
- OpenAI проиграла в суде битву за бренд io —... (447)
Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
Дата: 2025-10-22 15:50
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз).
Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст.
Иллюстрация: Sora Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub.
Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов.
Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка.
Подробнее на iXBT
Предыдущие новости
Раньше на этом российском заводе выпускали Mitsubishi Outlander, а сейчас — Haval M6. Калужский завод «Автомобильные технологии» оформил ОТТС на китайский кроссовер
Ранее Haval M6 выпускали на российском предприятии Haval в Туле, а сейчас машину выпускают в Калуге на заводе «Автомобильные технологии» (бывший «ПСМА Рус», на котором выпускали автомобили Mitsubishi, Peugeot, Citroen и Opel — в том числе Mitsubishi Outlander). Как сообщает «Автопоток», «Автомобильные технологии» оформили новое Одобрение типа на Haval M6 — теперь изготовителем...
«Это радикальное изменение в работе космических систем». SpaceX открывает доступ к лазерной технологии Starlink сторонним компаниям, начиная с Muon Space
Компания Muon Space установит лазерные терминалы Starlink на свои спутники, чтобы обеспечить клиентам своей спутниковой группировки передачу данных в режиме, близком к реальному времени. Muon Space заявила, что это соглашение включат её спутники в глобальную цифровую инфраструктуру Starlink. Компания Muon Space проектирует и строит спутниковые группировки для своих клиентов...
В России — от 3,3 млн рублей, а в Китае всего 104 тыс. юаней (1,2 млн рублей). Great Wall Kingkong Poer 2026 вышел на рынок
Great Wall Motor вывела на домашний рынок пикап Kingkong Poer 2026. Машина оснащается 2,0-литровыми моторами — бензиновым и дизельным, а цены стартуют всего лишь от 89,8 тыс. юаней (1,05 млн рублей). В России самый доступный Kingkong Poer 2025 — с 2,0-литровым бензиновым мотором, «механикой» и полным приводом — стоит 3,3 млн рублей. В Китае аналогичный Kingkong Poer 2026...
На АвтоВАЗе и так проблем хватает: удлинённую Lada Niva Travel заморозили, возможно, навсегда
Инсайдер под ником KhaDm сообщил, что в сентябре на АвтоВАЗе прошло несколько закрытых совещаний, где руководство решало, как улучшать положение. Ситуация следующая: у дилеров до сих пор стоят непроданные Lada Aura 2024 года, электрический E-Largus ограничился партией из трёх-пяти машин, а Lada Iskra пока так и не вышла в полноценное серийное производство. Фото KhaDm Одним из...