Онлайн-архивы могут создать «черную дыру» в истории XXI века

Всестороннее проникновение массовых коммуникаций и онлайновых сервисов хранения данных представляют огромный риск для истории и архивного дела. Исследователи из Британской библиотеки заявили, что некоторые аспекты истории XXI века могут остаться неизвестными последующим поколениям, если электронные онлайн-архивы будут по-прежнему преобладать.

Линн Бридли, исполнительный директор Британской библиотеки, опубликовала статью, в которой подробно рассказала об опасности потерять многие сведения из-за несовершенства технологий и протоколов современного интернета. По ее словам, наши потомки могут обнаружить «черную дыру» в истории XXI века, если не предпринять решительные меры.

В качестве примера, Бридли рассматривает Олимпийские игры в Сиднее в 2000 году. Этому спортивному событию было посвящено 150 тематических сайтов, однако все они прекратили существование практически сразу после церемонии закрытия игр. В электронных архивах в Национальной библиотеки Австралии можно найти резервные копии некоторых из них, однако для получения доступа к ним необходимо личное присутствие.

Аналогичная ситуация произошла сразу после инаугурации 42-ого президента США Барака Обамы. В последовавшую за церемонией ночь с сайта Белого дома были удалены все ссылки на внешние ресурсы, связанные с именем Джорджа Буша-младшего. Из-за отсутствия каких-либо других внешних связей с остальным интернетом, данные ресурсы остаются доступны только по результатам поисковых машин.

В условиях мирового финансового кризиса, когда неблагоприятный экономический климат уничтожает десятки компаний ежедневно, их названия исчезают из памяти одновременно с их сайтами.

Не стоит во всем уповать на поисковые машины, утверждает Линн Бридли. Принято считать, что поисковые роботы индексируют все страницы в интернете без исключений. Однако это предположение не совсем верно – существует множество ресурсов, которые полностью или частично остаются за пределами внимания роботов.

Причиной тому могут послужить плохо обозначенные ключевые слова, специальный запрет на деятельность поисковых роботов или чрезмерная «глубина» (количество переходов по иерархическому дереву страниц) сайта.

Бридли призывает библиотеки и СМИ внимательнее относится к цифровому материалу и старательно резервировать все данные, чтобы в дальнейшем облегчить доступ к информации о XXI веке. При этом Британская библиотек собирается самостоятельно подать пример подобного бережного обращения с данными. В планы этой организации входит собрать самый полный архив всех печатных и цифровых СМИ, посвященных грядущим Олимпийским играм 2012 года в Лондоне.

Автор Павел Урушев
Павел Урушев— редактор отдела науки интернет медиахолднга Правда.Ру
Обсудить