- Сквозные трещины в иллюминаторе: экипаж... (987)
- Омниканальная коммуникационная платформа МТС... (1082)
- Mozilla выпустила Firefox 148 с тем самым... (1068)
- Суд решил, что OpenAI не крала у xAI... (1111)
- Энтузиаст «научил» свою собаку вайб-кодингу,... (744)
- В Белоруссии начали продавать Lada Iskra —... (1015)
- Складка на экране iPhone Fold будет.... (1109)
- 7000 мАч, 144 Гц и MIL-STD-810H в смартфоне... (729)
- Записаться в поликлинику или закрыть... (959)
- SambaNova Systems объявила даже не о... (1027)
- В условиях санкций Huawei в прошлом году... (787)
- Tecno показала концепт модульного магнитного... (1070)
- В России стартовали продажи обновленного... (946)
- Не умеешь — научим, не хочешь — заставим:... (695)
- Sonos рискнет ещё раз полностью переделать... (1012)
- Компактный корпус без всяких «аквариумных»... (1027)
Можно попробовать прямо сейчас и отыскать предка-князя: нейросети Яндекса теперь справляются с расшифровкой дореволюционных рукописей
Дата: 2023-01-25 12:37
Команда Яндекса сообщила о новом достижении проекта по развитию нейросетей, распознающих текст. Разработчики научили фирменные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией.
Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллионам страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой, включая метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Как отмечают разработчики, сервис «Поиск по архивам» пригодится историкам, социологам, демографам, генеалогам и простым пользователям, которые ищут сведения о своей семье.
Новый алгоритм оптического распознавания учитывает особенности почерка и структуру архивных документов, а также справляется с символами и буквами, опознаёт больше не использующимися в русском языке. Нейросеть прошла обучение на сотнях тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров.
Руководитель «Поиска Яндекса» Елена Бубнова рассказала:
Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса.
Подробнее на iXBT
Предыдущие новости
«Судная ночь в ФРГ ещё впереди», «Нелётная погода в Германии объявлена!». Хакеры Killnet начали «коллективную кибератаку» на ФРГ
Хакеры из российской группировки Killnet на своей страничке в Telegram заявили о начале «коллективной кибератаки» на ФРГ, о чем было объявлено в Telegram-канале группы. К своей DDoS-атаке хакеры пригласили присоединиться другие группировки, которые поддерживают Россию. В 10:11 по московскому времени было опубликовано сообщение о начале атаки. «Иснайд: Судная ночь в ФРГ ещё...
Внутренне ядро Земли остановилось и затем поменяло направление вращения. Свежее исследование говорит, что это могло случиться всего 14 лет назад
Несмотря на то, что в целом строение Земли для учёных является в достаточной степени понятным, мы знаем далеко не всё. К примеру, вполне возможно, что внутреннее ядро нашей планеты совсем недавно даже по человеческим меркам почти прекратило своё вращение, а, возможно, и вовсе начало вращаться в обратном направлении. Исследователи из лаборатории SinoProbe Пекинского...
Lockheed Martin испытала прототип мобильного комплекса лазерного ПВО класса 50 кВт
Lockheed Martin сообщила о получении «первого света» на лазерном комплексе, который будет устанавливаться на боевые бронированные машины для маневренной системы ПВО малой дальности (DEIMOS). Система предназначена для перехвата мин, снарядов, ракет, беспилотников и вертолётов. Источник изображения: Lockheed...
Сбербанк создал собственное ПО для банкоматов и предлагает его другим
Сбер первым среди российских банков зарегистрировал собственное программное обеспечение для банкоматов в реестре Минцифры РФ, заявив, что это ПО поможет сократить расходы на обслуживание и повысить безопасность банкоматов. Управляющее программное обеспечение (ПО) для банковских устройств от Сбера InterSphere включено в реестр отечественного ПО. InterSphere полностью управляет...