- В США при загадочных обстоятельствах исчез... (988)
- ИИ-серверы HPE стали хуже продаваться, но... (651)
- Подготовка миссии Artemis 2 к Луне... (744)
- «Хаббл» прислал первое за четыре месяца... (632)
- SpaceX и Amazon получат малую часть... (667)
- Xiaomi представила один из самых доступных... (669)
- Получены первые прямые снимки термоядерных... (636)
- Внедорожник Kia, который не оценили. Kia... (722)
- До 245 Тбайт, PCIe 5.0 и QLC NAND: DapuStor... (643)
- Руководитель подразделения ИИ-инфраструктуры... (705)
- Китай временно остался без аварийного... (670)
- Northrop Grumman испытывает новый... (708)
- Первые тесты AMD Ryzen 7 9850X3D с огромным... (761)
- 32 дюйма, QLED, Google TV — всего 150... (768)
- Альтернатива iPhone и Android-смартфонам.... (697)
- M**a отложила выпуск очков смешанной... (704)
Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
Дата: 2025-10-22 15:50
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз).
Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст.
Иллюстрация: Sora Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub.
Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов.
Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка.
Подробнее на iXBT
Предыдущие новости
Раньше на этом российском заводе выпускали Mitsubishi Outlander, а сейчас — Haval M6. Калужский завод «Автомобильные технологии» оформил ОТТС на китайский кроссовер
Ранее Haval M6 выпускали на российском предприятии Haval в Туле, а сейчас машину выпускают в Калуге на заводе «Автомобильные технологии» (бывший «ПСМА Рус», на котором выпускали автомобили Mitsubishi, Peugeot, Citroen и Opel — в том числе Mitsubishi Outlander). Как сообщает «Автопоток», «Автомобильные технологии» оформили новое Одобрение типа на Haval M6 — теперь изготовителем...
«Это радикальное изменение в работе космических систем». SpaceX открывает доступ к лазерной технологии Starlink сторонним компаниям, начиная с Muon Space
Компания Muon Space установит лазерные терминалы Starlink на свои спутники, чтобы обеспечить клиентам своей спутниковой группировки передачу данных в режиме, близком к реальному времени. Muon Space заявила, что это соглашение включат её спутники в глобальную цифровую инфраструктуру Starlink. Компания Muon Space проектирует и строит спутниковые группировки для своих клиентов...
В России — от 3,3 млн рублей, а в Китае всего 104 тыс. юаней (1,2 млн рублей). Great Wall Kingkong Poer 2026 вышел на рынок
Great Wall Motor вывела на домашний рынок пикап Kingkong Poer 2026. Машина оснащается 2,0-литровыми моторами — бензиновым и дизельным, а цены стартуют всего лишь от 89,8 тыс. юаней (1,05 млн рублей). В России самый доступный Kingkong Poer 2025 — с 2,0-литровым бензиновым мотором, «механикой» и полным приводом — стоит 3,3 млн рублей. В Китае аналогичный Kingkong Poer 2026...
На АвтоВАЗе и так проблем хватает: удлинённую Lada Niva Travel заморозили, возможно, навсегда
Инсайдер под ником KhaDm сообщил, что в сентябре на АвтоВАЗе прошло несколько закрытых совещаний, где руководство решало, как улучшать положение. Ситуация следующая: у дилеров до сих пор стоят непроданные Lada Aura 2024 года, электрический E-Largus ограничился партией из трёх-пяти машин, а Lada Iskra пока так и не вышла в полноценное серийное производство. Фото KhaDm Одним из...