Яндекс представил новый сервис «Поиск по архивам» для расшифровки исторических записей с дореволюционной орфографией. Благодаря специально обученной нейросети старинные рукописи мгновенно преобразуются в печатный текст.
В базе сервиса насчитывается свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Документы можно искать по каталогам или через строку поиска. Также можно настроить фильтры по годам, фондам, архивам и описям.
Алгоритм, построенный на основе системы оптического распознавания символов, учитывает несколько параметров:
Специалисты Яндекса обучали нейросеть на массиве данных из сотен тысяч рукописных строк из текстов XVII–XIX веков. В дальнейшем количество доступных отсканированных файлов и хранилищ будет увеличиваться.
Напомним, что Яндекс заблокировал более 151 тысячи аккаунтов рекламодателей в 2022.
Источник: Коммерсант