- Бывший босс Tekken ушёл из Bandai Namco для... (590)
- Google вот-вот представит Googlebook —... (628)
- 16-минутная демонстрация операционной... (578)
- Как у Маска: в Threads внедрят ИИ-бота,... (679)
- Утечка раскрыла дату выхода Elden Ring:... (623)
- Обновление Dell SupportAssist вызвало... (676)
- TikTok бросила вызов Booking: теперь можно... (544)
- Garmin представила «простые в использовании»... (729)
- Nvidia выпустила драйвер с поддержкой Forza... (1696)
- FSP показала 2000-ваттный блок питания —... (526)
- Машины научили «жаловаться» на ямы на... (672)
- Слухи: Subnautica 2 «утекла» в руки пиратов... (689)
- BitLocker взломали за 5 минут — даже на... (857)
- Баг в обновлении добавил в Google Chrome 148... (802)
- Samsung выпустила бету One UI 9 на... (609)
- ИИ сломал правила кибербезопасности —... (854)
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей
Дата: 2023-01-25 12:37
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией.
Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллионам страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.
Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, а также справляется с символами и буквами, опознаёт больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.
Руководитель «Поиска Яндекса» Елена Бубнова рассказала:
Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.
Подробнее на iXBT
Предыдущие новости
«Судная ночь в ФРГ ещё впереди», «Нелётная погода в Германии объявлена!». Хакеры Killnet начали «коллективную кибератаку» на ФРГ
Хакеры из российской группировки Killnet на своей страничке в Telegram заявили о начале «коллективной кибератаки» на ФРГ, о чем было объявлено в Telegram-канале группы. К своей DDoS-атаке хакеры пригласили присоединиться другие группировки, которые поддерживают Россию. В 10:11 по московскому времени было опубликовано сообщение о начале атаки. «Иснайд: Судная ночь в ФРГ ещё...
Внутренне ядро Земли остановилось и затем поменяло направление вращения. Свежее исследование говорит, что это могло случиться всего 14 лет назад
Несмотря на то, что в целом строение Земли для учёных является в достаточной степени понятным, мы знаем далеко не всё. К примеру, вполне возможно, что внутреннее ядро нашей планеты совсем недавно даже по человеческим меркам почти прекратило своё вращение, а, возможно, и вовсе начало вращаться в обратном направлении. Исследователи из лаборатории SinoProbe Пекинского...
Lockheed Martin испытала прототип мобильного комплекса лазерного ПВО класса 50 кВт
Lockheed Martin сообщила о получении «первого света» на лазерном комплексе, который будет устанавливаться на боевые бронированные машины для маневренной системы ПВО малой дальности (DEIMOS). Система предназначена для перехвата мин, снарядов, ракет, беспилотников и вертолётов. Источник изображения: Lockheed...
Сбербанк создал собственное ПО для банкоматов и предлагает его другим
Сбер первым среди российских банков зарегистрировал собственное программное обеспечение для банкоматов в реестре Минцифры РФ, заявив, что это ПО поможет сократить расходы на обслуживание и повысить безопасность банкоматов. Управляющее программное обеспечение (ПО) для банковских устройств от Сбера InterSphere включено в реестр отечественного ПО. InterSphere полностью управляет...