- Тонкий смартфон с 7000 мАч, 120 Вт и... (895)
- Комета-невидимка: объект (139359) 2001... (1000)
- Samsung Galaxy S26, Galaxy S26 Plus и Galaxy... (533)
- Учёные нашли способ превращения испорченного... (542)
- Обнаружен самый «вёрткий» астероид Солнечной... (523)
- В ближайшее время SSD подорожают ещё больше:... (500)
- Представлен Peugeot 408 нового поколения —... (690)
- Складной iPhone с экраном без складки выйдет... (546)
- Американская атомная батарейка готова:... (726)
- Asus представила игровой ноутбук TUF Gaming... (783)
- M**a забронировала 6,6 ГВт атомных мощностей... (665)
- Иск Илона Маска к OpenAI дошёл до суда... (704)
- Новая статья: Итоги 2025 года:... (530)
- NASA: телескоп Nancy Grace Roman стартует в... (576)
- Батареи CATL показали рекордно низкую... (677)
- Первый запуск года Falcon 9 с 29 спутниками... (581)
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей
Дата: 2023-01-25 12:37
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией.
Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллионам страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.
Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, а также справляется с символами и буквами, опознаёт больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.
Руководитель «Поиска Яндекса» Елена Бубнова рассказала:
Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.
Подробнее на iXBT
Предыдущие новости
«Судная ночь в ФРГ ещё впереди», «Нелётная погода в Германии объявлена!». Хакеры Killnet начали «коллективную кибератаку» на ФРГ
Хакеры из российской группировки Killnet на своей страничке в Telegram заявили о начале «коллективной кибератаки» на ФРГ, о чем было объявлено в Telegram-канале группы. К своей DDoS-атаке хакеры пригласили присоединиться другие группировки, которые поддерживают Россию. В 10:11 по московскому времени было опубликовано сообщение о начале атаки. «Иснайд: Судная ночь в ФРГ ещё...
Внутренне ядро Земли остановилось и затем поменяло направление вращения. Свежее исследование говорит, что это могло случиться всего 14 лет назад
Несмотря на то, что в целом строение Земли для учёных является в достаточной степени понятным, мы знаем далеко не всё. К примеру, вполне возможно, что внутреннее ядро нашей планеты совсем недавно даже по человеческим меркам почти прекратило своё вращение, а, возможно, и вовсе начало вращаться в обратном направлении. Исследователи из лаборатории SinoProbe Пекинского...
Lockheed Martin испытала прототип мобильного комплекса лазерного ПВО класса 50 кВт
Lockheed Martin сообщила о получении «первого света» на лазерном комплексе, который будет устанавливаться на боевые бронированные машины для маневренной системы ПВО малой дальности (DEIMOS). Система предназначена для перехвата мин, снарядов, ракет, беспилотников и вертолётов. Источник изображения: Lockheed...
Сбербанк создал собственное ПО для банкоматов и предлагает его другим
Сбер первым среди российских банков зарегистрировал собственное программное обеспечение для банкоматов в реестре Минцифры РФ, заявив, что это ПО поможет сократить расходы на обслуживание и повысить безопасность банкоматов. Управляющее программное обеспечение (ПО) для банковских устройств от Сбера InterSphere включено в реестр отечественного ПО. InterSphere полностью управляет...