wget Скачать для автономного просмотра, включая абсолютные ссылки



Я пытаюсь загрузить всю веб-страницу, используя следующую команду



wget -p -k www.myspace.com/


Это действительно загружает страницу и любые изображения или скрипты в этом каталоге, но я пытаюсь выяснить, как загрузить эту страницу для полностью автономного просмотра. Как бы я связал каждое изображение, сценарий и таблицу стилей в исходном коде для www.myspace.com включая внешние ссылки?

382   2  

2 ответов:

wget -e robots=off -H -p -k http://www.myspace.com/

Флаг-H или --span-hosts необходим для полного зеркала, так как страница, скорее всего, будет содержать содержимое на хостах за пределами www.myspace.com домен. Игнорируйте роботов для хорошей меры.

wget -mk http://www.myspace.com/

Работает на меня. Я не уверен насчет myspace или любого другого сайта, который вы пытаетесь отразить конкретно, но иногда вам приходится передавать некоторые другие варианты, чтобы обойти политику отсутствия роботов. Я не буду говорить, как это сделать, потому что это означает, что вы делаете то, что не должны делать. Хотя это, безусловно, возможно.

Comments

    Ничего не найдено.