¿Qué es y cómo bloqueamos el acceso de un agente de usuario (Bot o navegador) en un sitio web [Consejos NGINX]

En primer lugar, veamos en términos generales qué es este agente de usuario de un navegador de Internet y qué utiliza.

¿Qué es el agente de usuario (o agente de usuario)?

Todo lo que significa navegador de Internet (Internet Explorer, Safari, Opera, Firefox, Chrome, etc.) tienen un software agente que interactúa con el sitio web que visitas, a nivel del servidor host. Este software realiza la conexión a Internet con el sitio web, comprende, comprueba y mostrará el contenido de la página a la que se accede. En definitiva, asegura la interacción entre el usuario y el servidor host que sirve al usuario las páginas web solicitadas accediendo a una URL específica sobre el protocolo HTTP/ HTTPS.
User Agent contiene en el encabezado entregado al servidor al que accede, información sobre el software utilizado por el usuario, el sistema operativo, la versión del paquete de software del navegador. Por ejemplo, el agente de usuario de Google Chrome proporcionará al servidor información sobre la versión de Google Chrome utilizada y el sistema operativo del usuario.

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3163.100 Safari/537.36 

El encabezado user-agent anterior significa que una versión de Google Chrome 70 en una computadora con Procesador AMD, Arquitectura 64-bit OS Windows 10.
Probablemente te preguntarás por qué aparece Mozilla como agente de usuario de Chrome. Se trata de una especie de truco utilizado por Google (y por Microsoft en IE) para facilitar el acceso de los usuarios de Chrome a todos los sitios compatibles con Mozilla y Safari. AppleWebKit es el motor de reproducción de contenido.

Los webmasters o administradores de servidores web pueden bloquear el acceso de ciertos agentes de usuario en webhosts alojados. La mayoría de las veces, esta limitación está establecida robots web (bots web) ese acceso caótico o excesivo a las páginas web de un sitio web. Afortunadamente, estos bots tienen un agente de usuario específico y pueden detectarse fácilmente en los registros del servidor web.

Cómo bloquear el acceso de agente de usuario en un servidor web con NGINX

Tomemos el escenario donde ya no queremos permitir que los usuarios accedan al sitio web con sistemas operativos Windows Navegador de internet XP y Mozilla Firefox 5.0.

Agregamos el código debajo del archivo de configuración nginx, al bloque "servidor":

  if ($http_user_agent = "Mozilla/5.0 (Windows NT 5.1; rv:52.0) Gecko/20100101 Firefox/52.0"){
 return 403;
 }

Guarde el archivo nginx.conf o el archivo específico de un sitio web, si usa una configuración personalizada (gen sitios disponibles), entonces reiniciar el servicio NGINX.
Todos los usuarios con Firefox 5.0 (incluidas todas las versiones hasta 5.9) en Windows XP, será redirigido a error 403 (Prohibido).

No elegí accidentalmente este ejemplo. A partir de Firefox 52.9.0, Mozilla ha dejado de admitir usuarios Windows XP si Windows Vista. Sistemas operativos cuyo soporte fue detenido por Microsoft en 2014, respectivamente 2017 para Windows Vista.

Apasionado por la tecnología, escribo con gusto en StealthSettings.com desde el año 2006. Tengo una amplia experiencia en sistemas operativos: macOS, Windows y Linux, así como en lenguajes de programación y plataformas de blogs (WordPress) y para tiendas en línea (WooCommerce, Magento, PrestaShop).

Cómo » Internet » Internet Explorer » ¿Qué es y cómo bloqueamos el acceso de un agente de usuario (Bot o navegador) en un sitio web [Consejos NGINX]
Deja un comentario