mikaprok (mikaprok) wrote,
mikaprok
mikaprok

Random Access Memory



Одно из подсознательных допущений эпохи всеобщей интернетизации – информация единожды попавшая в поисковик точно где-то сохранится и будет оставаться проиндексированной (квази) вечно.

Почему и как обычно не спрашивают.

Все привыкли видеть кэшированные копии искомых ресурсов в Google и воспринимают их наличие, как данность.

Однако это никакая не аксиома. Более того, даже для относительно свежего массива данных это сомнительное утверждение.

Начнем с того, что стремительно растущее количество данных (и их не менее быстро снижающее качество :-)) ведет к известному эффекту – сокращению времени их хранения поисковиками.

Несколько лет назад индексы Google полностью перестраивались раз в пять лет, сегодня говорят уже о трех годах. Слухи о том, сколько именно будет хранится ссылка на необновляемую страницу, которую никто не ищет – отдельная тема.

Ушедшие с концами в небытие домены существуют в виде кэша год.

Дальше по идее за дело должна взяться Wayback Machine (WM), 279+ миллиардное хранилище web-антиквариата.

Кроме WM пользователи, желающие ознакомится с историей сети, могут полагаться только на добродушных провайдеров, кэширующих страницы и щедрых представителей хостингов.

И те и другие – вымирающий вид.




Посему остановимся на функционировании WM. По идее, весь смысл ее существования – делать снимки состояния ресурсов на определенный временной момент и с известной периодичностью проверять изменение их статуса.

Ни политических, ни социальных подвязок быть не должно. Глобальный архив добра и зла в одном флаконе.

Что мы видим в реальности?

Компания FlexiSpy, предлагающая специальный софт для перехвата звонков, сообщений и GPS координат владельца мобильного устройства, какое-то время назад опубликовала у себя на портале пользовательский опрос. Исходя из него более 50% супругов изъявили желание следить за своими вторыми половинами.

Тема оказалась настолько интересной, что целый ряд топовых изданий обратил на нее внимание. В частности, New York Times.

Спустя несколько месяцев и сам красивый график и его следы в WM исчезли.

Любой ресурс может исключить себя из процесса бот-кроулинга в явном виде с помощью «robots.txt».

Проблема в том, что он уже был индексирован, а теперь “This URL has been excluded from the Wayback Machine.”

Никто не может объяснить, как такое могло случится.

Это далеко не первый случай.




Доказать post factum присутствовала ли страница в архиве или ее каким-то образом оттуда выпилили не представляется возможным.

WM – граница, за которой ничего нет.

У самого интернет-архива нет своего архива.

Удаление страницы оттуда означает цифровую смерть.

«Чего не хватишься, ничего у вас нет».

В последнее время появилась куча сервисов, отслеживающих и анализирующих fake news. Там хранится история за несколько лет по выбранным темам.

Но, во-первых, сама подборка крайне однобока, какой бы вариант мы не выбрали.

Во-вторых, никто не гарантирует сохранность контента и его неизменность. Арбитраж все равно волей-неволей ложится на плечи WM.

А она уже скомпрометирована.




Всё сказанное органично дополняется разнообразными «законами о забвении», многотысячными (для каждой территории) решениями судов, позволяющими навечно что-то удалять или блокировать пользователей, стирая их истории. И так далее и тому подобное.

Стоит погрузиться вглубь зыбкой глади волн мировой ноосферы и окажется, что старая добрая бумага на пыльных полках не такой уж хрупкий носитель информации по сравнению магнитным носителем и кнопкой «Del».





Конечно, если рассматривать реальное положение вещей, а не слушать абстрактные рассуждения о тотальной дигитализации, как многие любят.
https://telegram.me/mikaprok


Tags: #wayback machine, #архив, #интернет, #история, #политика, history, internet, politics, usa, wayback machine
Subscribe
promo mikaprok july 7, 00:17 88
Buy for 20 tokens
Редкий для меня служебно-личный пост. За последние полгода накопилось просто какое-то невероятное количество тем, о которых стоит поговорить, но за повседневной текучкой не доходят руки. Причем большей частью тем вполне жежешных форматов, которые не нужно упрощать-адаптировать и…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 22 comments