Cómo descargar un sitio web completo con Wget
Wget es un software libre (GNU) que sirve para recuperar archivos mediante HTTP, HTTPS y FTP, los protocolos de Internet más utilizados. Es una herramienta de línea de comandos no interactivo, por lo que puede ser fácilmente llamado desde scripts, con jobs del Cpanel, terminales sin soporte de X-Windows, etc.
Wget tiene muchas características para hacer fácil la recuperación de archivos de gran tamaño desde cualquier sitio web o FTP.
Si alguna vez tienes que descargar todo un sitio Web, quizás para visualización sin conexión, Wget puede hacerte el trabajo.
Un ejemplo: Este comando descarga el sitio Web: www.website.org/tutorials/html/.
$ wget
–recursive
–no-clobber
–page-requisites
–html-extension
–convert-links
–restrict-file-names=windows
–domains website.org
–no-parent
Las opciones son:
—recursive: descargar todo el sitio web.
—domains website.org: no seguir enlaces externos website.org.
—no-parent: no seguir enlaces fuera de los tutoriales de directorio / html /.
—page-requisites: obtener todos los elementos que componen la página (imágenes, CSS y así sucesivamente).
—html-extension: guardar los archivos con la extensión .html.
—convert-links: convertir enlaces para que se trabajen a nivel local, off-line.
—restrict-file-names=windows: modificar los nombres de archivos para que puedan funcionar con Windows también.
—no-clobber: no sobrescribir los archivos existentes (usado en caso de que la descarga se interrumpa y reanuda).