wget Скачать для автономного просмотра, включая абсолютные ссылки
Я пытаюсь загрузить всю веб-страницу, используя следующую команду
wget -p -k www.myspace.com/
Это действительно загружает страницу и любые изображения или скрипты в этом каталоге, но я пытаюсь выяснить, как загрузить эту страницу для полностью автономного просмотра. Как бы я связал каждое изображение, сценарий и таблицу стилей в исходном коде для www.myspace.com включая внешние ссылки?
2 ответов:
wget -e robots=off -H -p -k http://www.myspace.com/Флаг-H или --span-hosts необходим для полного зеркала, так как страница, скорее всего, будет содержать содержимое на хостах за пределами www.myspace.com домен. Игнорируйте роботов для хорошей меры.
wget -mk http://www.myspace.com/Работает на меня. Я не уверен насчет myspace или любого другого сайта, который вы пытаетесь отразить конкретно, но иногда вам приходится передавать некоторые другие варианты, чтобы обойти политику отсутствия роботов. Я не буду говорить, как это сделать, потому что это означает, что вы делаете то, что не должны делать. Хотя это, безусловно, возможно.
Comments