Cómo usar Wget para descargar sitios web a su PC

¿Alguna vez se preguntó si había una forma de descargar un sitio web sin un navegador web? Estás de suerte. Con el poder de la línea de comandos de Linux, todo es posible. Hay varios métodos para completar esta tarea, pero en este artículo nos centramos en wget.

¿Qué es wget?

wget es una utilidad de línea de comandos de GNU para recuperar contenido de servidores web. Como descargador, wget es muy poderoso por derecho propio. wget es capaz de trabajar con múltiples protocolos, como HTTP, HTTPS y FTP. Otras capacidades de la utilidad wget incluyen:

  • capacidad para correr silenciosamente o en segundo plano
  • integrado con scripts de Linux o trabajos CRON
  • puede ejecutar múltiples descargas a la vez
  • descarga archivos que requieren una contraseña

¿Por qué wget?

Si bien hay una multitud de herramientas que pueden realizar actividades en el sitio web, wget permite un alcance amplio. Le da al usuario la capacidad de funcionar sin un navegador web al:

  • descargar una copia completa de un sitio web
  • descargar un archivo específico de un sitio web
  • automatizar la recuperación de un archivo bajo demanda
  • obtener un documento de un portal de autenticación

wget también está integrado en la mayoría de las distribuciones de Linux, por lo que está disponible desde el principio y no se requiere ninguna instalación adicional.

Conceptos básicos de wget

Comenzar con wget es bastante simple. Primero, abra una Terminal Linux.

Una vez que se abre una ventana de terminal, puede ejecutar wget como se muestra a continuación:

Reemplace “URL” con la URL exacta del sitio web.

URL de Wget de Linux

Para reanudar un archivo parcialmente descargado, utilice un -c cambie su comando de la siguiente manera:

Para que la descarga de wget sea silenciosa, agregue el -q cambie a su comando wget inicial:

Si no está seguro del uso adecuado de las opciones dentro de wget, utilice lo siguiente:

Aparte de los sitios web, también puede descargar un archivo usando wget. Por ejemplo:

Simplemente tomaría el archivo y lo guardaría en el directorio actual.

Si desea guardar en un nombre de archivo diferente o en una ubicación diferente, use el -O bandera.

Opciones de FTP

Como se señaló anteriormente, wget también admite FTP. Si solo especifica un sitio FTP:

wget asumirá que desea un inicio de sesión anónimo. Alternativamente, puede especificar manualmente cosas como nombre de usuario y contraseña con las siguientes banderas:

  • --ftp-user=USER: especifica el nombre de usuario para iniciar sesión
  • --ftp-password=PASS: especifica la contraseña
  • --no-passive-ftp: desactiva el modo de transferencia pasiva

Tiempos de espera, reintentos y descargas fallidas

Finalmente, wget viene con varias opciones relacionadas con los problemas de conexión del servidor y los tiempos de espera. No todas las fallas se pueden solucionar, por supuesto, pero las siguientes banderas están destinadas a ayudar a resolver los problemas del servidor:

  • --tries=NUMBER: especifica el número de veces que se reintentará la descarga
  • --retry-connrefused: Vuelve a intentar la descarga incluso si el servidor rechaza la conexión
  • --timeout=SECONDS: configuración global – cuánto tiempo esperar antes de los tiempos de espera
  • --wait=SECONDS: cuánto tiempo esperar entre descargas exitosas (si se repite)

¿Quién usaría wget?

Al leer esta publicación, es posible que esté pensando: “Esto suena complicado y mucho más difícil que usar un navegador web”, pero cualquiera puede encontrar un uso para esta utilidad, ya sea como administrador de sistemas o como programador. A continuación se muestran dos ejemplos de cómo utilizo este comando a lo largo del día, y mi función a veces cambia.

Facilita mi trabajo como investigador de seguridad porque puedo programar este comando para descargar varios sitios web a la vez. Puedo hacer esto creando un archivo de texto (usando cualquier editor de texto) que contenga una cantidad de URL en una lista (una URL por línea). Al ejecutar el siguiente comando con el -i Switch, wget descargará cada sitio web de la lista.

Como administrador de sistemas, puedo obtener documentos de ubicaciones protegidas por contraseña con facilidad. Es posible que esto no lo ayude tan bien fuera de línea, pero al ejecutar wget permite, le permite agregar credenciales a un sitio.

¡Ahí tienes! ¿Fue tan difícil como pensaba? Poder automatizar sus acciones con wget le ahorrará tiempo y le dará la posibilidad de trabajar también sin conexión. ¿Qué tienes que perder?

Deje un comentario a continuación y háganos saber si le resultó útil.

¿Es útil este artículo?

¡Compártelo en redes!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *