Еврейский народ всегда отличался любовью к письменности, охватывая самые разнообразные сферы жизни. Об этом сообщает Ynet.
На протяжении веков, рассеявшись по всему миру, евреи создавали уникальные языковые диалекты, такие как арабо-еврейский или греко-еврейский. Каждый регион и каждая эпоха оставляли свой неповторимый след в стиле письма, позволяя исследователям с высокой точностью определять время и место создания того или иного текста по форме букв.
В последние годы Общество Фридберга по еврейским рукописям, а затем и Национальная библиотека Израиля, предприняли масштабную работу по сканированию всех доступных рукописей. Оцифрованные материалы были загружены на платформу «Кти́в» Национальной библиотеки. Среди них особое место занимает Каирская гениза – крупнейшее и наиболее разнообразное собрание еврейских рукописей средневековья, обнаруженное в чердаке синагоги Бен-Эзра и других местах в Каире.
Каирская гениза представляет собой настоящую «капсулу времени», открывающую окно не только в жизнь еврейской общины Каира, но и в историю других еврейских общин, находившихся с ней в контакте. Однако, несмотря на свою бесценность, большая часть этого архива оставалась доступной лишь узкому кругу исследователей. Согласно статистике, менее трети из примерно 400 тысяч единиц хранения были каталогизированы, а расшифровки (транскрипции) содержат менее 10% всех фрагментов.
Ситуация кардинально меняется благодаря новому, прорывному проекту. Теперь стало возможным автоматически расшифровывать огромные объемы оцифрованных материалов из Каирской генизы и других подобных коллекций за относительно короткий срок. Использование передовых технологий позволяет преодолеть главное препятствие – колоссальные временные затраты на ручную транскрипцию. Это открывает путь к тому, чтобы древние тексты стали доступны для поиска и изучения по всему миру.
Ранее автоматическое чтение рукописей и текстовый поиск в исторических документах казались практически невыполнимой задачей. В то время как оптическое распознавание символов (OCR) для печатных материалов стало обыденностью, применение подобной технологии к рукописному тексту считалось делом далекого будущего. Однако в 2023 году Европейский исследовательский совет (ERC) выделил беспрецедентный грант в размере 10 миллионов евро для проекта MiDRASH (Миграция текстовых традиций и надписей через крупномасштабный вычислительный анализ средневековых рукописей на иврите). Этот проект призван произвести революцию в изучении древних еврейских текстов.