- Vivo решила выйти на рынок камер вне... (1388)
- Не менее 8500 мАч, но теперь без... (1157)
- Прокуроры 20 штатов США подали в суд на... (658)
- Из кухни к конвейеру: 10 000... (636)
- Cisco вернулась на вершину: акции компании... (722)
- Огромная презентация Xiaomi рассекречена:... (941)
- Turbo-удар: новая серия OnePlus выйдет... (928)
- Экраны двух размеров, 5600 мАч, защита... (1321)
- Очень яркий OLED-экран, уникальный дизайн и... (1018)
- Памятный обвал 2026: смартфоны с 16 ГБ ОЗУ... (705)
- Суперхит Huawei Mate 80 стал ещё интереснее... (951)
- Суперхит Huawei Mate 80 получил большое... (840)
- 7400 мАч, 80 Вт, Snapdragon 8 Gen 5, IP68/69... (1081)
- В этом году мировой рынок электромобилей и... (722)
- Ноябрьские продажи Tesla в США провалились... (735)
- Руководство SpaceX уведомило сотрудников о... (961)
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей
Дата: 2023-01-25 12:37
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией.
Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллионам страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.
Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, а также справляется с символами и буквами, опознаёт больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.
Руководитель «Поиска Яндекса» Елена Бубнова рассказала:
Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.
Подробнее на iXBT
Предыдущие новости
«Судная ночь в ФРГ ещё впереди», «Нелётная погода в Германии объявлена!». Хакеры Killnet начали «коллективную кибератаку» на ФРГ
Хакеры из российской группировки Killnet на своей страничке в Telegram заявили о начале «коллективной кибератаки» на ФРГ, о чем было объявлено в Telegram-канале группы. К своей DDoS-атаке хакеры пригласили присоединиться другие группировки, которые поддерживают Россию. В 10:11 по московскому времени было опубликовано сообщение о начале атаки. «Иснайд: Судная ночь в ФРГ ещё...
Внутренне ядро Земли остановилось и затем поменяло направление вращения. Свежее исследование говорит, что это могло случиться всего 14 лет назад
Несмотря на то, что в целом строение Земли для учёных является в достаточной степени понятным, мы знаем далеко не всё. К примеру, вполне возможно, что внутреннее ядро нашей планеты совсем недавно даже по человеческим меркам почти прекратило своё вращение, а, возможно, и вовсе начало вращаться в обратном направлении. Исследователи из лаборатории SinoProbe Пекинского...
Lockheed Martin испытала прототип мобильного комплекса лазерного ПВО класса 50 кВт
Lockheed Martin сообщила о получении «первого света» на лазерном комплексе, который будет устанавливаться на боевые бронированные машины для маневренной системы ПВО малой дальности (DEIMOS). Система предназначена для перехвата мин, снарядов, ракет, беспилотников и вертолётов. Источник изображения: Lockheed...
Сбербанк создал собственное ПО для банкоматов и предлагает его другим
Сбер первым среди российских банков зарегистрировал собственное программное обеспечение для банкоматов в реестре Минцифры РФ, заявив, что это ПО поможет сократить расходы на обслуживание и повысить безопасность банкоматов. Управляющее программное обеспечение (ПО) для банковских устройств от Сбера InterSphere включено в реестр отечественного ПО. InterSphere полностью управляет...