Новый амбициозный проект перевода тысяч редких исторических документов Библиотеки конгресса США в цифровой вид с помощью GNU/Linux и Open Source призван сохранить всеобщее достояние до того, как оно не обветшало окончательно.
Финансовую поддержку акции "Оцифровка американских документов в Библиотеке конгресса" оказала организация Sloan Foundation. По словам Брюстера Кале (Brewster Kahle) из Internet Archive (крупного архива, который в свое время полностью отказался от Windows, перейдя на платформу GNU/Linux), занимающегося разработкой технологии оцифровки, программное обеспечение с открытым кодом (Open Source) сыграет "абсолютно критическую" роль в реализации проекта.
В качестве главного программного инструмента будет использоваться Scribe: "Scribe - это система сканирования, которая снимает высококачественные изображения с книг и проводит над ними ряд операций, распознает текст и сжимает, так что на выходе вы получаете красивые печатные версии книг, для которых появляется функция поиска [подразумеваются файловые форматы документов PDF и DjVu - прим. перев.]", - пояснил Кале. Для манипуляции картинками используются различные Open Source-утилиты, среди которых, например, netpbm и ImageMagick.
Доктор Джереми Адамсон (Jeremy E. A. Adamson), директор по коллекциям и сервисам Библиотеки конгресса США, объяснил выбор Scribe для данного проекта тем, что Internet Archive, использующий в своей работе подобное Open Source-решение, уже продемонстрировал "эффективное производство высококачественным изображений" с его помощью.
Источник:
nixp.ru
|