![](/f/d04527141d4c8cf19427269145ca760f.jpg)
Последнее обновление
![](/f/5fa9e5f833c60668de018050d9d7108f.jpg)
Wayback Machine - самая популярная часть Сайт Интернет-архива. Этот бесплатный онлайн-инструмент, впервые представленный в 2001 году, позволяет вам «вернуться в прошлое», чтобы увидеть, как веб-сайты по всему миру выглядели в определенные моменты времени. Характеристики Wayback Machine 562 миллиард веб-страниц на момент написания этой статьи, и с каждым годом их количество добавляется гораздо больше.
Взглянем на Wayback Machine и на то, что в ней особенного.
Интернет-архив Введение
Интернет-архив, созданный Брюстером Кале и Брюсом Гиллиатом, является некоммерческой организацией с заявленной миссией «универсальный доступ ко всем знаниям». С самого начала, организация предоставила бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение программы.
На сегодняшний день все, что собрано Интернет-архивом, занимает более 70 Петабайт
Машина обратного пути
Только одна часть Интернет-архива, Wayback Machine, была разработана для сбора измененного или удаленного содержания веб-сайтов. С момента запуска он стал одним из самых популярных и узнаваемых мест в сети. Кале и Гиллиат назвали это место в честь вымышленного устройства для путешествий во времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкла».
Хотя Internet Archive не открывал сайт для публики до октября 2001 года, Wayback Machine начала архивировать кэшированные веб-страницы с мая 1996 года. До 2001 года на цифровых магнитных лентах хранилась информация, доступная только избранным ученым и исследователям. Когда пять лет спустя все стало доступно публике (как это давно планировалось), оно уже содержало более 10 миллиардов заархивированных страниц.
Хранение и коллекции
Сегодня на сайте хранятся исторические веб-данные о кластере узлов Linux. Wayback Machine загружает всю общедоступную информацию и файлы данных на веб-страницы через свой механизм сканирования. Однако сюда включается не все, что размещено на веб-сайте, поскольку некоторый контент ограничен или хранится в базах данных, которые недоступны. Из-за этого некоторые веб-сайты сканируются лучше, чем другие, в зависимости от того, как разработчики создавали сайт за раз.
Вы также заметите, что чем новее архив, тем больше контента доступно для любого сайта. Новый инструмент Internet Archive, представленный в 2005 году, является одной из причин, по которой новые данные являются более полными. Archive-It.org помогает преодолевать несоответствия на частично кэшированных веб-сайтах, позволяя организациям и создателям контента собирать и сохранять коллекции цифрового контента.
О сканировании
Поисковые роботы, которых иногда называют пауками или роботами-пауками, так же стары, как сам Интернет. Эти сканеры представляют собой интернет-боты, которые постоянно просматривают Интернет в целях индексации, что делает их важным компонентом любой современной поисковой системы. Сканеры, используемые Wayback Machine для создания цифровых снимков веб-сайтов, поступают из различных источников, которые со временем менялись.
Как вы быстро заметите, частота создания снимков сильно зависит от веб-сайта. Как правило, чем крупнее (и, возможно, популярнее) веб-сайт, тем больше выполняется сканирование. Кроме того, многое зависит от того, как часто на сайте меняются страницы. Даже самые маленькие веб-сайты в конечном итоге сканируются, если нет на то причины. Например, сайты, защищенные паролем, не сканируются, равно как и веб-сайты, владельцы сайтов которых просили их не включать.
Использование Wayback Machine
Веб-сайтом Wayback Machine легко пользоваться всем. Чтобы найти исторические снимки веб-сайта, введите его название в поисковую систему сайта. На странице результатов поиска гиперссылки обозначают дату и время архивации сайта. Щелкните ссылку, чтобы перейти на сайт «назад во времени».
В следующих примерах вы можете увидеть первую страницу веб-сайта Apple, записанную в феврале 2005 г. и ноябре 2014 г., и домашнюю страницу CNN с датами в марте 2004 г. и сентябре 2010 г.
Примечание. Эти обходы также включают ссылки на другие страницы, записанные в указанные даты, а не только на домашние страницы.
![Apple ползать](/f/69f84fe06fe4f7bd1d1d7f18acc59cba.jpg)
![CNN сканирование](/f/f2abe1d924c707329dcea1e05a1287c8.png)
Дополнительные инструменты
Созданный как для исследователей, так и для широкой публики, Wayback Machine имеет несколько встроенных инструментов, которые могут пропустить обычные пользователи. Например, по дизайну на страницы результатов поиска легко ссылаться. Как объяснялось, «Если вы найдете заархивированную страницу, на которую вы хотели бы сослаться на своей веб-странице или в статье, вы можете скопировать URL-адрес. Вы даже можете использовать нечеткое сопоставление URL и указание даты... но это немного сложнее ".
Wayback Machine также позволяет владельцам сайтов использовать функцию «Сохранить страницу сейчас» для сохранения определенной страницы. И все же это не идеально. В настоящее время эта функция не добавляет URL-адрес сайта ни в какое сканирование в будущем. Кроме того, запрос не сохраняет более одной страницы. Тем не менее, это хороший первый шаг - заархивировать главную страницу вашего веб-сайта для исторических записей.
![Список компьютеров GroovyPost Wayback](/f/8902e4222f7cd28daebdd39c70398373.png)
Вам не нужно посещать Wayback Machine каждый раз, чтобы выполнить новый поиск. Вместо этого вы можете найти контент, введя адрес на панели инструментов вашего веб-браузера. Используйте этот формат для всех поисков: http://web.archive.org/*/www.yoursite.com/*. Например, используйте http://web.archive.org/*/www.groovypost.com/* чтобы найти заархивированные страницы для GroovyPost!
Мобильные приложения и инструменты разработчика
Наконец, Wayback Machine можно найти не только через Интернет. Вы можете найти приложение Wayback Machine для iOS а также Android. Также есть расширения для Chrome, Safari и Firefox. Разработчики также захотят ознакомиться с API-интерфейсами Internet Archive Wayback Machine. Это облегчает разработчикам получение информации о данных захвата Wayback.
Интернет-архиватор Wayback Machine поддерживает несколько различных API. Таким образом, разработчикам будет проще получать информацию о данных захвата Wayback.
Возвращение «назад во времени» для просмотра ваших любимых веб-сайтов - это причина № 1 для посещения Wayback Machine. Это также отличный инструмент для тех, кто изучает историю веб-сайтов для школьных проектов или использования в бизнесе. Что бы вы ни делали, посетите Wayback Machine и посмотрите, что вы откроете, выполнив несколько простых шагов.
Для получения дополнительной информации об услуге подписки Archive-It Internet Archive посетите Официальный веб-сайт и начните вносить свой вклад сегодня же!