- Новая статья: Mewgenics — девяти жизней... (183)
- Только большие ядра, 24 потока и частота до... (193)
- «Гонка вооружений» в сфере ИИ бессмысленна —... (95)
- У Steam произошёл массовый сбой: миллионы... (235)
- NASA утвердило запуск Artemis 2: 6... (455)
- «Москвич» запустил производство... (366)
- «Москвич» запустил производство... (386)
- Марсоход NASA Perseverance научился... (435)
- Первым ИИ-гаджетом OpenAI станет умная... (252)
- General Catalyst инвестирует $5 млрд в... (527)
- Крупнейший раунд в истории ИИ: OpenAI... (391)
- «Один нас подвёл. Другой отверг»: датамайнер... (574)
- Телескоп «Джеймс Уэбб» составил первую... (392)
- «Блокнот» всё больше превращается в WordPad... (585)
- Ubisoft подтвердила разработку двух «очень... (494)
- USDT ожидает самое большое месячное падение... (640)
Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
Дата: 2025-10-22 15:50
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз).
Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст.
Иллюстрация: Sora Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub.
Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов.
Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка.
Подробнее на iXBT
Предыдущие новости
Раньше на этом российском заводе выпускали Mitsubishi Outlander, а сейчас — Haval M6. Калужский завод «Автомобильные технологии» оформил ОТТС на китайский кроссовер
Ранее Haval M6 выпускали на российском предприятии Haval в Туле, а сейчас машину выпускают в Калуге на заводе «Автомобильные технологии» (бывший «ПСМА Рус», на котором выпускали автомобили Mitsubishi, Peugeot, Citroen и Opel — в том числе Mitsubishi Outlander). Как сообщает «Автопоток», «Автомобильные технологии» оформили новое Одобрение типа на Haval M6 — теперь изготовителем...
«Это радикальное изменение в работе космических систем». SpaceX открывает доступ к лазерной технологии Starlink сторонним компаниям, начиная с Muon Space
Компания Muon Space установит лазерные терминалы Starlink на свои спутники, чтобы обеспечить клиентам своей спутниковой группировки передачу данных в режиме, близком к реальному времени. Muon Space заявила, что это соглашение включат её спутники в глобальную цифровую инфраструктуру Starlink. Компания Muon Space проектирует и строит спутниковые группировки для своих клиентов...
В России — от 3,3 млн рублей, а в Китае всего 104 тыс. юаней (1,2 млн рублей). Great Wall Kingkong Poer 2026 вышел на рынок
Great Wall Motor вывела на домашний рынок пикап Kingkong Poer 2026. Машина оснащается 2,0-литровыми моторами — бензиновым и дизельным, а цены стартуют всего лишь от 89,8 тыс. юаней (1,05 млн рублей). В России самый доступный Kingkong Poer 2025 — с 2,0-литровым бензиновым мотором, «механикой» и полным приводом — стоит 3,3 млн рублей. В Китае аналогичный Kingkong Poer 2026...
На АвтоВАЗе и так проблем хватает: удлинённую Lada Niva Travel заморозили, возможно, навсегда
Инсайдер под ником KhaDm сообщил, что в сентябре на АвтоВАЗе прошло несколько закрытых совещаний, где руководство решало, как улучшать положение. Ситуация следующая: у дилеров до сих пор стоят непроданные Lada Aura 2024 года, электрический E-Largus ограничился партией из трёх-пяти машин, а Lada Iskra пока так и не вышла в полноценное серийное производство. Фото KhaDm Одним из...