Ezhe.ru архив

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Мусор в Сети




> Куда большее значение представляет обратный вопрос - общей эфемерности,
сиюминутности интернет-информации. Информации о дне сегодняшнем - терабайты
ежедневно, но не существует механизма, гарантирующего, что сегодняшнее
содержание СМИ, ТВ, блогов и частной переписки сохранится хотя бы лет на
десять-двадцать вперед. // Ревич.

Да, спасибо за описание проблемы, здесь кое-что новое про отсутствие
процедуры сохранения.

Отдельная история - долговечность форматов и долговечность носителей.
Я про это написал прошлой осенью в Отчёте Совета по правам человека "О
защите прав граждан в цифровом пространстве", в разделе про риски перехода
на электронные оригиналы.
http://www.president-sovet.ru/presscenter/news/spch_podgotovil_doklad_o_polo
zhenii_del_s_pravami_i_svobodami_cheloveka_i_grazhdanina_v_tsifrovom_pr/

Там есть и про ненадёжность "облаков" и интернет-хранилищ, но больше про
сами носители.
Вставляю дальше длинную цитату из себя любимого:

"...
2. Низкая надёжность хранения цифровых документов и материалов.  Мало кто из
современных <цифровизаторов> отдаёт себе отчёт, какова средняя
продолжительность жизни форматов данных и носителей данных. Мы по-прежнему
способны читать тексты и изображения, имеющие давность в тысячи лет (на
бумаге, керамике, камне, металле, пергаменте, дереве, даже на бересте), но
уже практически неспособны прочесть цифровые данные конца 1980-х и начала
1990-х годов. Это объясняется следующими обстоятельствами:

а) цифровые форматы живут не более 15-20 лет. Сейчас в большинстве
организаций (или на дому) практически невозможно прочесть когда-то
сохранённые данные с семидюймовой дискеты (конец 1980-х), с пятидюймовой
дискеты (начало 1990-х), с дискет 3,5 дюйма (середина 1990-х и начало
2000-х); более того, уже довольно затруднительно найти устройство для чтения
когда-то популярных дисков CD или DVD (конец 1990-х - начало 2000-х). 
Форматы цифровых кассет для видео и аудио из начала 2000-х годов - также
устарели, такие кассеты практически не на чём просмотреть. Популярный в
1990-х-2010-х годах формат представления графики и звука Flash уже
фактически <умер>, многие сделанные на Flash проекты и контент <умерли>
вместе с форматом. Та же проблема наблюдается и с картриджами игр для
устаревших игровых приставок.

б) средний срок жизни операционных систем и офисных приложений - также не
превышает 20 лет. Смена более полутора десятков версий операционных систем и
офисных приложений для ПК за последние 30 лет сделала практически
<нечитаемыми> огромные массивы старых документов, программ и изображений. 
Практически нигде не хранятся старые версии персональных компьютеров с
устаревшими версиями MS DOS, Windows 3.1, Windows XP на тот невероятный
случай, когда появится необходимость прочесть <документ из 90-х>. Та же
проблема наблюдается и с языками программирования, на которых создаются
ИТ-системы: старые ИТ-системы через 20-25  лет становится станет невозможно
поддерживать и развивать. 

Итак, средний срок жизни каждого цифрового формата хранения и обработки
данных, после истечения которого им практически невозможно массово
пользоваться, в реальности не превышает 15-20 лет. Можно предположить, что в
ближайшие десятилетия этот процесс устаревания форматов, программ и
оборудования продолжится и даже ускорится.

в) срок жизни физических носителей также укладывается в указанные 15-20 лет.
Большинство носителей данных, наподобие магнитных жёстких дисков, CD-дисков,
магнитных лент остаются работоспособными не долее 15-20 лет, а зачастую
выходят из строя (осыпаются, размагничиваются, теряют данные) гораздо раньше
из-за воздействия внешней среды (ультрафиолетового излучения, влажности,
магнитных полей, перепадов температур, ударов и падений).

г) уязвимость ИТ-инфраструктуры.  Опыт хранения критически важных данных в
базах данных, в Интернете, в <облаках> в последние 30 лет - показывает, что
сбои баз данных, банкротства компаний, закрытие проектов (показательный
пример - уничтожение миллионов сайтов при закрытии <народного> сервиса
хостинга сайтов Geocities), пожары в дата-центрах, также не позволяют
надеяться на сохранность конкретных экземпляров важных данных свыше все тех
же 15-20 лет.

Более того, в случае чрезвычайных ситуаций природного, техногенного или
социального характера (массовых беспорядков, пожара, катастроф, войны,
бомбёжек, ядерного удара) в первую очередь исчезнут не бумажные документы, а
именно электронные данные - причём мгновенно.
Даже простое отключение электричества по той или иной причине на большой
территории на сколько-нибудь серьёзный срок (от нескольких дней) сделает
невозможным использование данных и документов в электронной форме на этой
территории. Бумажные же документы будут по-прежнему доступны и
функциональны.

Все это означает, что при переходе на электронное хранение всех важных
документов и материалов как основной метод хранения, государству, бизнесу и
обществу придётся обеспечивать мощный, очень дорогой процесс постоянного
резервирования (<бэкапирования>) и переноса данных в новые форматы.

Этот процесс будет заведомо давать огромные искажения и потери в результате
не только неизбежной халатности персонала и программно-аппаратных сбоев, но
и в результате того, что в силу обычной нехватки ресурсов (рабочих рук,
времени и денег) далеко не всё будет переноситься в новые форматы, часть
данных будет признаваться неважными и <забываться>, оставляться в старом
формате или просто выбрасываться.

Таким образом, оцифровка всех данных не повышает надёжность хранения, а
кардинально снижает её в среднесрочном периоде, создаёт риски забвения и
потери данных.

При этом оцифровка, как мы отметили выше, значительно повышает доступность и
<сверхпроводимость> документов и данных для ненадлежащих лиц - мошенников,
манипуляторов. Особенно это критично в отношении важных для граждан
документов об идентичности, рождении и смерти, собственности, семейном
положении, заболеваниях, образовании и т.п., определяющих их жизнь в
правовом пространстве.

Мы считаем, что принципиально важно предписать государственным и частным
организациям сохранять во всех случаях <гибридный> электронно-бумажный
документооборот, особенно в части содержащих персональные данные документов
граждан, признавая бумажную, <твёрдую> копию оригиналом документа.
...".

Игорь Ашманов. 



Оценить письмо Reputatio: http://ezhe.ru/reputatio/66b1c4a924


Home | Main Index | Thread Index