- Покупка SambaNova Systems может помочь Intel... (633)
- 7-местный кроссовер российской сборки SWM... (671)
- Google представила бета-версию перевода в... (604)
- Китай создаст первое в мире судно на... (570)
- «Роснано» подала миллиардный иск к бывшим... (603)
- Apple тоже придётся повышать цены на... (768)
- Конкурент iPhone 17 Pro Max и Galaxy S25... (833)
- Популярные смартфоны Samsung линейки Galaxy... (1100)
- Mobvoi TicNote Pods — первые в мире наушники... (1123)
- Благодаря Samsung новые чипы Snapdragon и... (727)
- Vivo решила выйти на рынок камер вне... (1318)
- Не менее 8500 мАч, но теперь без... (1035)
- Прокуроры 20 штатов США подали в суд на... (611)
- Из кухни к конвейеру: 10 000... (575)
- Cisco вернулась на вершину: акции компании... (623)
- Огромная презентация Xiaomi рассекречена:... (864)
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей
Дата: 2023-01-25 12:37
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией.
Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллионам страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.
Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, а также справляется с символами и буквами, опознаёт больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.
Руководитель «Поиска Яндекса» Елена Бубнова рассказала:
Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.
Подробнее на iXBT
Предыдущие новости
«Судная ночь в ФРГ ещё впереди», «Нелётная погода в Германии объявлена!». Хакеры Killnet начали «коллективную кибератаку» на ФРГ
Хакеры из российской группировки Killnet на своей страничке в Telegram заявили о начале «коллективной кибератаки» на ФРГ, о чем было объявлено в Telegram-канале группы. К своей DDoS-атаке хакеры пригласили присоединиться другие группировки, которые поддерживают Россию. В 10:11 по московскому времени было опубликовано сообщение о начале атаки. «Иснайд: Судная ночь в ФРГ ещё...
Внутренне ядро Земли остановилось и затем поменяло направление вращения. Свежее исследование говорит, что это могло случиться всего 14 лет назад
Несмотря на то, что в целом строение Земли для учёных является в достаточной степени понятным, мы знаем далеко не всё. К примеру, вполне возможно, что внутреннее ядро нашей планеты совсем недавно даже по человеческим меркам почти прекратило своё вращение, а, возможно, и вовсе начало вращаться в обратном направлении. Исследователи из лаборатории SinoProbe Пекинского...
Lockheed Martin испытала прототип мобильного комплекса лазерного ПВО класса 50 кВт
Lockheed Martin сообщила о получении «первого света» на лазерном комплексе, который будет устанавливаться на боевые бронированные машины для маневренной системы ПВО малой дальности (DEIMOS). Система предназначена для перехвата мин, снарядов, ракет, беспилотников и вертолётов. Источник изображения: Lockheed...
Сбербанк создал собственное ПО для банкоматов и предлагает его другим
Сбер первым среди российских банков зарегистрировал собственное программное обеспечение для банкоматов в реестре Минцифры РФ, заявив, что это ПО поможет сократить расходы на обслуживание и повысить безопасность банкоматов. Управляющее программное обеспечение (ПО) для банковских устройств от Сбера InterSphere включено в реестр отечественного ПО. InterSphere полностью управляет...