БУДЕМ ЗНАКОМЫ, WAYBACK MACHINE — I-NURE
Пошук…
- Деталі
- Категорія: Технології
Насколько информация в интернете постоянна? Если информация на сайте обновилась или вообще уже не существует, то осталась ли где-то копия?.. Как ее увидеть? Нам поможет WAYBACK MACHINE. Что же это такое и как оно работает?
Наш век – это век информации. Несомненно, мы пропускаем через себя огромные потоки информации ежедневно. От забавных видео на YouTube до рекламы на улице.
На смену библиотекам пришел Интернет. Цифровая база знаний не уступает бумажным источникам, порой даже превосходит их. Тебе не нужно никуда идти – только «в сеть».
Что если я хочу посмотреть на сайт, скажем, неделю назад? Или… месяц? Его оригинал давно обновился, но осталась ли где-то копия?.. Ответ – да. Причем копия, которая была месяц назад, два; три года. А может сайт вообще не существует сегодня в принципе?
ЗНАКОМИМСЯ С WAYBACK MACHINE
WAYBACK MACHINE – это некоммерческая организация, которая появилась в 1996 году. Целью архива является сохранение культурно-исторических ценностей в нашу с вами не простую эпоху. Сайт предоставляет бесплатный доступ к своим материалам. Посмотреть там есть на что – копии сайтов сохранены на долгосрочный период.
Но как это работает? Архив сохраняет сайты либо с помощью бота, либо с помощью пользователей. В любом случае, в архив помещают копию страницы с ее кодом JavaScript’a, поэтому можно легко просмотреть точную копию того или иного сайта.
Сейчас архив носит название Wayback Machine. Авторы упоминают, что это прямая отсылка на «Шоу Рокки и Буллвинкля», где в одном из эпизодов появилась машина «WABAC», что произносится дословно как way-back. Устройство должно было отправить героев в самые важные момент истории людей. Забавное решение.
С 2007 года архив имеет официальный статус библиотеки, но чего это стоило создателям?
В 2012 размер архива был 10 петабайт. В 2016 – уже 15 и 502 млрд страниц. Действительно впечатляет. Хотя уже в 2019 размер перевалил за 45 петабайт.
ОКЕЙ, И КАК ЭТИМ ПОЛЬЗОВАТЬСЯ?
Все крайне просто: достаточно зайти на archive.org и вбить свой желанный сайт. После обработки сайт выдаст вам все состояния сайта и его обновления. Взглянем поподробнее.
Сверху – полный таймлайн вместе с частотой обновления. Открытый мною сайт для рассмотрения – youtube.com. Легко увидеть, что начал он свое существование в 2005 году и сейчас находится на пике частоты обновления.
Выбрав определенный месяц и день, вы можете «клацнуть» на кружок и открыть меню с полным списком снапшотов того дня. Берем любой, и смело «клацаем».
ОХ, УЖ ЭТОТ YOUTUBE В 2011!
Раньше было лучше, бесспорно. С помощью архива можно серфить прошлое сайтов, возможно даже испытывать ностальгию по старым добрым временам.
Вот тут шведский инди-разработчик пытается впарить свою поделку пользователю в пол цены под предлогом alpha- версии. Это 2011 год.
А вот Маркус Перссон уже продал свою игру за 2.5 млрд долларов уже в 2014 году. Занимательно.
Так что теперь вы можете и сами «поковырять» прошлое интернета со столь удобным инструментом и повспоминать траву, которая зеленее.
DarkMinimum
- Попередня
- Наступна
Популярні статті
Читати далі
Підписатися на RSS
Telegram
FB
NURE
Wayback Machine: 5 альтернатив, которые стоит попробовать
Большая часть Интернета эфемерна.
Веб-страницы существуют до тех пор, пока их нет. Содержимое на них существует до тех пор, пока оно не будет обновлено, а затем исчезнет.
Если не копаться в архиве.
Архивирование сети важно для культурных и антропологических исследований. Это также полезно для бизнеса, например, для конкурентного анализа. Это может даже помочь документировать или отслеживать политические процессы.
Ваша конкретная причина поиска архивного контента может определить, какая служба работает лучше всего.
Wayback Machine — самый известный архив.
Скриншот, https://archive.org/web/, январь 2023 г.
Интернет-архив — некоммерческая организация, а Wayback Machine — веб-версия ее архива, содержащая абсолютно огромное количество данных.
Вы можете запросить сохранение веб-страницы в ее текущем состоянии, а также использовать такие инструменты, как API.
Каким бы огромным ни был архив Wayback Machine, он, скорее всего, не заполнен на 100%. Если у вас возникли проблемы с поиском чего-то конкретного или вам интересно, есть ли альтернативы с большим количеством функций, эти альтернативы могут помочь.
Я не буду рассматривать платные подписки SaaS, так как не считаю платную услугу реальной альтернативой бесплатной, предоставляемой некоммерческой организацией.
Поехали!
1. Проект «Помни»
«Помни» — это исключительная альтернатива Wayback Machine, поскольку она объединяет несколько разных источников, включая саму Wayback Machine.
На веб-сайте вы можете получить доступ к архивам из нескольких источников с помощью инструмента «Путешествие во времени».
Скриншот, http://timetravel.mementoweb.org/, январь 2023 г.
Это первое отличие, которое делает Memento таким классным, и оно включает в себя и некоторые другие архивы из этого списка. Это означает, что это настраиваемый опыт и, вероятно, один из самых полных.
Еще одной отличительной особенностью Memento является расширение Chrome, которое позволяет вам выбрать дату, когда вы хотите просмотреть текущую страницу. Это переносит инструмент туда, где вы просматриваете, вместо того, чтобы заставлять вас вводить URL-адрес в форму.
Вы также можете создать снимок страницы и сгенерировать ссылку на нее, которая не сломается. Это особенно полезно для цитирования.
Если вы обеспокоены тем, что страница может исчезнуть или содержимое может обновиться, но вы хотите использовать информацию, создание одной из этих ссылок гарантирует, что люди смогут увидеть ваш первоисточник.
2. Archive.today
Archive.today — еще один инструмент для создания моментальных снимков. Он позволяет сохранить ссылку на страницу в том виде, в каком она существует в данный момент.
Переход по ссылке приведет пользователей к неизменяемой версии страницы.
Скриншот, https://archive.ph/, январь 2023 г.
Он также содержит некоторые относительно расширенные поисковые запросы, которые вы можете выполнять по доменам и URL-адресам, чтобы найти снимки, которые были сохранены с помощью этого инструмента.
Этот инструмент также имеет расширение для Chrome и приложение для Android.
Поиски в Memento могут включать результаты из Archive.today.
3. WebCite
WebCite предлагает мощные приложения для авторов, журналистов, ученых и издателей.
Он предлагает различные способы создания и представления заархивированных страниц и URL-адресов.
Скриншот, rhttps://webcitation.org/, январь 2023 г.
К сожалению, на момент публикации новые запросы не принимаются. Но вы все еще можете получить доступ к уже заархивированным страницам. Когда и если он снова начнет принимать запросы, это очень полезный инструмент для этого.
Самая мощная функция для авторов и издателей — возможность загрузить рукопись прямо на веб-сайт.
Инструмент будет сканировать каждую ссылку в загруженной рукописи и автоматически создавать архивы каждой из страниц, на которые есть ссылки, в том виде, в каком они существуют в настоящее время. Это экономит много времени, если вы использовали много ссылок на веб-сайты.
Если вы создали контент, который вы хотите, чтобы люди могли создавать снимки, вы можете добавить на свою страницу специальную ссылку WebCite, по которой пользователи могут щелкнуть. Это встраивает функции архива в вашу страницу, экономя время пользователей, если они решат использовать вашу работу в качестве цитирования.
4. GitHub
GitHub — это платформа для разработки и совместной работы, которая также отдает приоритет общедоступным проектам и открытому исходному коду.
Он документирует и архивирует код и программы с открытым исходным кодом и доступен для поиска другими архивами, такими как Wayback Machine.
Снимок экрана, https://github.com/explore, январь 2023 г.
Но, если вы ищете что-то, связанное с кодом или разработкой программного обеспечения, может быть проще сразу перейти на GitHub, чем использовать другой архивный сервис. .
Хотя у GitHub есть платные бизнес-планы, он бесплатен для обычного пользователя. Он даже предлагает 15 ГБ дискового пространства и некоторую вычислительную мощность в своей облачной среде разработки бесплатно для личного использования.
5. Веб-архивы для конкретных стран
В некоторых странах есть собственные веб-архивы.
Это может быть особенно полезной альтернативой Wayback Machine, если вы ищете веб-сайт, тесно связанный с конкретным местом или культурой страны.
В более специализированных архивах может быть более полная информация, если у вас возникли проблемы с ее поиском в другом месте, хотя, опять же, я хочу упомянуть, что первая альтернатива в этом списке, Memento, извлекается из нескольких разных архивов для разных стран.
Я также должен отметить, что многие архивы, относящиеся к стране, региону, образовательному учреждению или отдельной библиотеке, сотрудничают с Archive-it, поставщиком услуг, созданным The Internet Archive (создатели Wayback Machine).
Они курируют определенные коллекции на основе релевантности, но все партнеры Archive-it используют один и тот же источник: Интернет-архив.
Вот несколько веб-архивов для конкретных стран:
- Веб-архив Великобритании.
- Интернет-архив Библиотеки Конгресса.
- Интернет-архив Сингапура.
- Хорватский веб-архив.
Заключение
Когда вы ищете альтернативы Wayback Machine, вы можете не осознавать, что многие из них частично или полностью основаны на одном и том же архиве.
Но есть и другие службы, которыми вы можете воспользоваться. Некоторые из них имеют более полезные функции, в зависимости от ваших целей.
Это не исчерпывающий список альтернативных инструментов, но это большинство легкодоступных инструментов для обычного пользователя.
Другие требуют ежемесячных платежей, а некоторые бесплатны для академических и юридических учреждений, но не для отдельных пользователей.
Я решил сосредоточиться на лучших инструментах, которые можно использовать прямо сейчас без суеты.
Дополнительные ресурсы:
- Попробуйте эти инструменты и методы для экспорта результатов поиска Google в Excel
- 20 отличных поисковых систем, которые можно использовать вместо Google
- Как работают поисковые системы
Рекомендуемое изображение: Studio Romantic/Shutterstock
Категория SEO Инструменты
Использование Wayback Machine для архивирования (и резервного копирования) WordPress
Иногда резервное копирование WordPress дает сбой, и восстановление множества постов и страниц блога может стать серьезной проблемой. К счастью, их архивирование с помощью Wayback (time) Machine позволяет легко их восстановить.
Конечно, вы не можете вернуться в прошлое, но использование Wayback Machine не за горами. Он архивирует общедоступные веб-документы, чтобы сохранить человеческую культуру для будущих поколений.
В этом посте я подробно расскажу о Wayback Machine, о том, что это такое, как вы можете использовать его для автоматического или ручного архивирования сообщений и страниц блога, а также о том, как вы можете получить заархивированный контент. Я также покажу вам несколько плагинов, которые вы можете использовать для удобного архивирования.
Продолжить чтение или перейти вперед по этим ссылкам:
- Что такое машина обратного пути?
- Когда и что архивируется?
- Архивирование сообщений и страниц блога
- Доступ к вашему архивному содержимому
- Плагины для архивации WordPress
- Простой годовой архив
- Удаление страницы смарт-архива
- Средство проверки неработающих ссылок
Что такое машина обратного пути?
Wayback Machine — это трехмерный индекс, который архивирует общедоступные веб-страницы, сканируя их, подобно поисковым системам. Он был создан в 1996 году как некоммерческий проект The Internet Archive.
На самом деле это отсылка к популярному мультфильму Рокки и Буллвинкл . В сериале вымышленная машина времени мистера Пибоди, WABAC, была произнесена как «путь назад», и именно так индекс присвоил ее.
Архивирование сообщений и страниц блога с помощью Wayback Machine может оказаться полезным, если ваш сайт выйдет из строя, а резервные копии не удастся создать. Хотя вы не можете заархивировать весь динамический контент , текст ваших сообщений и страниц сохраняется, что означает, что вы можете копировать и вставлять его в новое сообщение.
Вы можете восстановить пропавшие сообщения и контент, одновременно внося свой вклад в некоммерческий проект. Архивируя свой сайт, вы сохраняете информацию и артефакты из культур и наследия человечества для будущих поколений и цивилизаций.
Будущие люди смогут просмотреть все, что заархивировано Wayback Machine, и получить доступ к цифровой истории и справочнику для обучения у нас. Подобно тому, как археологи находят древние артефакты из нашего прошлого, мы пытаемся использовать их для улучшения нашего будущего.
На самом деле, вот наш действительно классный пост, который почти полностью написан на снимках с Wayback Machine.
Когда и что архивируется?
Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к содержимому, защищенному паролем, или к защищенному частному серверу. Он также не сканирует сайты, которые мешают поисковым системам их сканировать.
Популярные сайты с большим трафиком сканируются автоматически, но вы можете заархивировать страницы вручную за несколько секунд.
Единственным предварительным условием является то, что вам нужно убедиться, что ваш веб-сайт WordPress настроен так, чтобы сканеры могли просматривать ваши страницы и сообщения. Чтобы убедиться, что ваш сайт может быть заархивирован:
- В административной панели WordPress нажмите Настройки > Чтение .
- В разделе Видимость в поисковых системах убедитесь, что поле для Запретить поисковым системам индексировать этот сайт флажок снят, затем нажмите Сохранить изменения (если вы их внесли).
Если у вас установлены и активированы какие-либо подключаемые модули с аналогичным параметром, обязательно измените его, чтобы разрешить поисковым роботам.
Как только это будет сделано, вы готовы архивировать свои сообщения и страницы.
Архивирование сообщений и страниц вашего блога
Существует два основных способа архивирования вашего сайта с помощью Wayback Machine.
Первый способ — ввести web.archive.org/save/
перед URL-адресом в адресной строке браузера. Вам не нужно опускать http:// или https:// в начале веб-адреса.
Вы также можете перейти на страницу веб-архива Wayback Machine и ввести URL-адрес страницы или публикации, которую вы хотите заархивировать, в поле под Сохранить страницу сейчас . Затем нажмите кнопку Сохранить страницу .
Вы можете заархивировать свое сообщение, посетив Way Back Machine и введя URL-адрес.В любом случае процесс занимает несколько секунд но может занять немного больше времени в зависимости от размера страницы. После завершения архивирования вы должны увидеть прямой URL-адрес, который вы можете скопировать и сохранить для прямого доступа к заархивированному сообщению или странице позже.
После того, как ваша страница будет заархивирована, добавив URL-адрес, вы можете получить прямую ссылку на архив.Доступ к вашему заархивированному содержимому
После того, как вы заархивировали свои сообщения и страницы, вы можете получить к ним доступ, посетив Wayback Machine. Имейте в виду, что полная архивация страницы может занять несколько дней, поэтому вы не сможете сразу получить доступ к заархивированному контенту, но позже он должен быть там.
Вы можете искать заархивированные страницы и сообщения, щелкнув значок сети. Затем введите URL-адрес в поле, которое динамически появляется в верхней части страницы, и нажмите . Введите на клавиатуре.
Вы можете искать ранее заархивированные сообщения и страницы.Если вы не помните точный URL поста или страницы, которую вы пытаетесь восстановить, вы можете ввести только свой основной веб-адрес или ссылку на свой блог. Wayback Machine должна получить все результаты, связанные с введенным вами адресом, включая строки URL.
Результаты поиска возвращают календарь с цветными кружками, чтобы выделить дни, когда содержимое было заархивировано. Вы можете навести указатель мыши на один из этих кружков, чтобы просмотреть список страниц, которые были проиндексированы в этот день.
Наведите указатель мыши на один из дней в календаре, чтобы просмотреть заархивированные страницы.Вы можете щелкнуть одно из гиперссылок в списке, чтобы просмотреть заархивированную страницу.
Оттуда вы можете скопировать и вставить текст в свой пост или редактор страниц и сохранить новую копию своего контента, чтобы восстановить свой сайт.
Вуаля ! Ваш сайт полностью восстановлен.
Плагины для архивирования WordPress
Если вам нужны другие способы архивирования ваших сообщений и страниц, ознакомьтесь с этими плагинами. Не все из них архивируют на Wayback Machine, но они предлагают другие дополнительные возможности архивирования.
Simple Yearly Archive
Simple Yearly Archive — довольно аккуратный и простой плагин WordPress, который позволяет отображать ваши архивы в виде списка по годам.
Работает в основном как обычный архив WP, но отображает все опубликованные посты, разделенные по годам публикации. Кроме того, вы также можете ограничить вывод определенными категориями и многое другое.
Smart Archive Page Remove
Плагин Smart Archive Page Remove позволяет удалять страницы архива, автоматически созданные WordPress.
WordPress автоматически создает архивы на основе автора, категории, тега и даты (ежедневно, ежемесячно и ежегодно) для ваших сообщений. Даже если вы не хотите использовать эти страницы (например, вы не хотите иметь ежедневный архив, потому что вы не публикуете несколько раз в день), они существуют, и к ним можно получить доступ по их автоматически сгенерированному URL-адресу.
Этот плагин добавляет пункт «Архивировать страницы» в раздел «Настройки» вашей панели администратора WordPress. Здесь вы можете выбрать, какие страницы архива вы хотите удалить, после чего их можно будет восстановить в любое время.
Средство проверки неработающих ссылок
Плагин проверки неработающих ссылок ничего не архивирует, но может помочь вам выяснить, какие страницы или сообщения отсутствуют на вашем сайте, поскольку он ищет неработающие ссылки.
Как только вы узнаете, что было потеряно, вы ищете это в Машине обратного пути. Затем вы можете скопировать и вставить свой текстовый контент на новую страницу или в публикацию и заменить старые ссылки новыми.
Подведение итогов
Это не машина реального времени, но если у вас возникли проблемы с восстановлением ваших сообщений или содержимого страницы после того, как ваш сайт сломался, поиск в Wayback Machine вашего ранее заархивированного контента может помочь вам вернуть его.