Архив сайта - из чего состоит, какие у него особенности


Рассмотрим скачанный архив и разберёмся в его внутренностях и особенностях. Содержимое каждого сайта упаковано в zip-архив. Если его открыть, мы увидим папку с названием домена и CSV файл:

 

В папке с названием домена лежат непосредственно файлы от сайта:

 

Вы можете заметить, что папки и конечные названия файлов отличаются от того, что отображалось в блоке "Структура страниц сайта" на странице с подробной информацией о домене:

 

С чем это связано? Основная задача MyDrop - помочь вебмастерам восстанавливать сайты на освобождающихся доменов и максимально помочь с сохранением трафика, который был. Очень важно сохранять именно старые URL, которые были до истечение срока домена. Даже если в URL страницы будет отличаться один символ, это может критическим образом повлиять на трафик (поисковый или реферальный).

Поэтому мы разделили хранение старых адресов URL-ов и хранение контента, который раньше был на каждой странице. Если бы сохраняли HTML файлы с именем, который был в URL, это бы не позволило нам сохранять большое количество сайтов корректно. Это связано с различием допустимых символов, которые могут употребляться в URL и названии файлов в различных ОС (Unix, Windows).

В восстановленном архиве используется система, которая обрабатывает все запросы пользователя (смотрит, какой URL запрашивается пользователем на сайте) и подгружает файлы с нужным контентом (скрипт смотрит какой HTML файл соответствует запрошенному URL'у). Все ссылки повторяются с исходного сайта и показывают тот же самый контент.

Все статичные файлы с первоначального сайта (изображения, а также файлы стилей и JavaScript) имеют тот же путь.

Отсюда мы переходим к CSV файлу и объяснению - зачем он нужен? Через CSV файл вы можете найти содержимое нужной вам ссылки и название папки с файлов в котором содержится HTML код для этой ссылки. Если вам нужно отредактировать контент по какой то конкретной ссылке, то вы ищете её в этом CSV файле.

Для работоспособности восстановленного сайта достаточно загрузить содержимое архива в папку хостинга. Все ссылки которые указаны в файле CSV будут работать точно так же, как и раньше на сайте до перехвата домена.