«Российская Государственная Библиотека» (РГБ) объявила о завершении проекта по созданию крупнейшего в Европе электронного хранилища книг. Объем хранилища равен 162 ТБ, что сравнимо с 3 млн книг. Новое хранилище создано в рамках реализации концепции «Национальной Электронной Библиотеки»: она предполагает оцифровку всех основных фондов библиотеки и организацию к ним доступа читателей.
Как рассказал CNews директор по информатизации «Российской Государственной Библиотеки» Александр Вислый, концепция реализуется с 2004 г. Создание мощного дата-центра — лишь небольшой этап. В отношении перспектив окончания работы по оцифровке фондов, он отметил, что это работа в определенном смысле «бесконечная». Проект по созданию нового дата-центра занял по времени чуть больше полугода, стартовав в марте.
На разных этапах реализации концепции «Национальной Электронной Библиотеки» подрядчиками выступают разные ИТ-компании. В данном случае проект по созданию хранилища осуществлен совместно с компаниями «Крок» и ЕМС. Как рассказали в пресс-службе EMC, компания была выбрана РГБ в качестве производителя и поставщика ядра проекта, а поставку и настройку системы реализовал «Крок». В «Крок» сообщили, что стоимость работ составила около 20 млн рублей. По словам Вислового, всего в год на развитие концепции выделяется порядка 50 млн рублей.
В рамках данного этапа мощности центра обработки данных (ЦОД) Российской государственной библиотеки были увеличены на базе блейд-серверов HP, установленных в HP c-Class Bladesystem, систем хранения данных EMC масштаба предприятия и дисковых полок для расширения емкости системы хранения данных HP MSA1500. Сообщается также, что обновленный ЦОД получил отказоустойчивое питание и современную систему кондиционирования мощностью 30 кВт. «Реализованный проект позволил нам получить дополнительные ресурсы», — отметил по этому поводу начальник управления информационных технологий «Российской Государственной Библиотеки» Олег Махно.
Сообщается, что объема дата-центра в 162 Тбайта хватит еще на три-четыре года. Оцифровка фондов пока проводится выборочно. Например, сейчас приоритет отдается книгам по тематике российского государства и государственности — сказывается тесное сотрудничество с Президентской библиотекой им. Б.Н.Ельцина. Всего на данный момент оцифровано не более 1,5% книжных фондов, объем которых составляет 40 млн. единиц. Из 350 тыс. уже переведенных в электронный формат книг основную массу составляют научные диссертации.
Однако Александр Вислый считает, что проект будет максимально полезен для читателей тогда, когда очередь дойдет до современной, наиболее востребованной литературы, а также учебников, монографий и справочников. Тем не менее, пока реализовать эту задачу не представляется возможным — благие намерения вступают в противоречии с российским законодательством. Согласно 4 части Гражданского кодекса РФ, оцифровать эти издания невозможно без предварительной договоренности с автором. Получить такие согласования по всем представленным в фондах книгам — попросту нереально.
«Эффективность проекта пока невысока именно из-за этого противоречия. Мы активно сотрудничаем с Государственной Думой и планируем вести дальнейшую работу в области законодательства. О существующей проблеме властям известно. К сожалению, от этого пока мало толку», — рассказал CNews Александр Вислый.
Доступ к электронным книгам пока получить также не просто. Сейчас книги в цифровом формате в виде постраничного изображения без преобразования в текст доступны лишь в помещении библиотек, с которыми установлены партнерские отношения. В стенах РГБ также оборудовано 300 рабочих мест, с помощью которых можно получить доступ к электронному хранилищу. В перспективе доступ к электронным книгам может быть открыт и через интернет, однако, это можно будет сделать только с теми произведениями, которые не защищены авторским правом.
По просьбе CNews, попытку оценить масштаб проекта предпринял Дмитрий Романов, директор по развитию технологий информационного менеджмента компании «Айти»: «Исполнители указывают объем хранилища 162 ТБ, но не указывают единицы хранения. Приведенная оценка (3 млн книг, что дает примерно 500 КБ на книгу) справедлива для текста книги. Но при этом тип контента (рукописи, ноты, диссертации) свидетельствует, что хранится не текст документов, а их электронные образы. Если оценить размер электронного образа одной страницы в 200 КБ, а среднее число страниц в книге принять равным ста, получим, что в хранилище загружено содержание около 80 тыс. книг (плюс-минус 20 тыс). Коллег можно поздравить, к большому сожалению, очень немного пресс-релизов об успешно завершенных проектах такого масштаба».