- Стирально-сушильная машина на 9 кг с... (123)
- Google лишает Gmail двух важных функций,... (154)
- Игровая консоль Steam Deck оказалась в... (311)
- AMD подстрахует Crusoe, продаст ей свои чипы... (702)
- Новая статья: Reanimal — мастер-класс, но не... (437)
- «Двойные» отпечатки: новый метод... (553)
- Три линзированных квазара стали инструментом... (412)
- NASA изучило, как люди реагируют на шум... (591)
- «Потерянные» B-звёзды: астрономы вычисляют... (660)
- Анализ 235 тысяч метеоров показал как... (776)
- Космологическая константа меняет знак: новые... (465)
- Тайна «снеговиков» на краю Солнечной системы... (543)
- Lenovo установила дедлайн для заказов по... (721)
- ИИ-модель AdGazer научилась предсказывать... (815)
- Google наконец-то заменит чип безопасности,... (814)
- Индия стремится к своему «DeepSeek-моменту»:... (542)
Новая модель DeepSeek сокращает объём токенов до 20 раз, сохраняя до 97% точности
Дата: 2025-10-22 15:50
DeepSeek-OCR — новая модель искусственного интеллекта китайской компании DeepSeek, которая модернизирует обработку больших объёмов текстовой информации за счёт преобразования текста и документов в визуальные представления. Такой подход позволяет значительно сжимать данные — до 7-20 раз по количеству токенов, необходимых для анализа, при сохранении высокой точности распознавания (до 97% на уровне сжатия менее чем в 10 раз).
Модель состоит из двух ключевых компонентов: DeepEncoder, который преобразует текст в изображения и сжимает их, и DeepSeek3B-MoE-A570M — языковой декодер с 3 млрд параметров и механизмом mixture-of-experts, который восстанавливает и интерпретирует сжатый визуальный текст.
Иллюстрация: Sora Технология особенно эффективна при работе с табличными данными, графиками и структурированной информацией, что открывает новые возможности применения в финансах, науке и медицине. DeepSeek-OCR доступен с открытым исходным кодом на платформах Hugging Face и GitHub.
Революционная методика через визуальные представления позволяет создавать языковые модели с гораздо более длинным контекстом и уменьшает необходимые вычислительные ресурсы, что снижает стоимость и повышает скорость работы ИИ-инструментов.
Это значительный технологический прорыв по сравнению с традиционным текстовым вводом в модели, который может привести к появлению более эффективных и мощных систем обработки естественного языка.
Подробнее на iXBT
Предыдущие новости
Раньше на этом российском заводе выпускали Mitsubishi Outlander, а сейчас — Haval M6. Калужский завод «Автомобильные технологии» оформил ОТТС на китайский кроссовер
Ранее Haval M6 выпускали на российском предприятии Haval в Туле, а сейчас машину выпускают в Калуге на заводе «Автомобильные технологии» (бывший «ПСМА Рус», на котором выпускали автомобили Mitsubishi, Peugeot, Citroen и Opel — в том числе Mitsubishi Outlander). Как сообщает «Автопоток», «Автомобильные технологии» оформили новое Одобрение типа на Haval M6 — теперь изготовителем...
«Это радикальное изменение в работе космических систем». SpaceX открывает доступ к лазерной технологии Starlink сторонним компаниям, начиная с Muon Space
Компания Muon Space установит лазерные терминалы Starlink на свои спутники, чтобы обеспечить клиентам своей спутниковой группировки передачу данных в режиме, близком к реальному времени. Muon Space заявила, что это соглашение включат её спутники в глобальную цифровую инфраструктуру Starlink. Компания Muon Space проектирует и строит спутниковые группировки для своих клиентов...
В России — от 3,3 млн рублей, а в Китае всего 104 тыс. юаней (1,2 млн рублей). Great Wall Kingkong Poer 2026 вышел на рынок
Great Wall Motor вывела на домашний рынок пикап Kingkong Poer 2026. Машина оснащается 2,0-литровыми моторами — бензиновым и дизельным, а цены стартуют всего лишь от 89,8 тыс. юаней (1,05 млн рублей). В России самый доступный Kingkong Poer 2025 — с 2,0-литровым бензиновым мотором, «механикой» и полным приводом — стоит 3,3 млн рублей. В Китае аналогичный Kingkong Poer 2026...
На АвтоВАЗе и так проблем хватает: удлинённую Lada Niva Travel заморозили, возможно, навсегда
Инсайдер под ником KhaDm сообщил, что в сентябре на АвтоВАЗе прошло несколько закрытых совещаний, где руководство решало, как улучшать положение. Ситуация следующая: у дилеров до сих пор стоят непроданные Lada Aura 2024 года, электрический E-Largus ограничился партией из трёх-пяти машин, а Lada Iskra пока так и не вышла в полноценное серийное производство. Фото KhaDm Одним из...