Bot

tag Servidores e infraestructuras
tag Internet y páginas web

Un Bot es una aplicación de software programada para realizar tareas específicas de forma autónoma y repetitiva. Su nombre viene de «robot», porque imitan el comportamiento humano pero con una velocidad y escala sobrehumanas.

En la actualidad aproximadamente el 50% del tráfico de internet no lo generan personas, sino estos asistentes automáticos.

Los «Buenos», los «Malos» y los «Inteligentes»

No todos los bots son iguales. Debes saber distinguir quién llama a tu puerta:

Tipo de BotFunción¿Es bienvenido?
Crawlers (Arañas)Rastrean la web para indexarla en Google o Bing.Sí. Sin ellos, nadie encontraría tu web.
Chatbots / AgentesAtienden clientes y resuelven dudas por ti.Sí. Ahorran costes y dan servicio 24/7.
ScrapersCopian tus precios o contenido para la competencia.Depende. Pueden ser molestos si roban tu trabajo.
SpambotsLlenan tus formularios de publicidad de criptomonedas.No. Son ruido puro que ensucia tus datos.
BotnetsMiles de bots coordinados para tumbar un servidor.Nunca. Son armas de ciberataque masivo.

Los Bots de la IA

En la actualidad, agentes de IA y modelos LLM tienen sus propios bots para navegar por sitios web o recopilar información. Algunas consideraciones sobre ellos:

  • Capacidad de Decisión: Los bots modernos pueden razonar. Si un cliente pide algo raro, el bot no se bloquea; busca una solución lógica o escala el problema al humano adecuado.
  • Voz y Visión: Ya no solo identifican texto, pueden «ver» una imagen de un error en tu pantalla o de una URL, o hablarte por teléfono con una entonación natural.
  • Identidad Digital: En muchos países, los bots ahora deben identificarse obligatoriamente como tales (mediante etiquetas en el código) para que el usuario sepa que no está hablando con un humano.

¿Cómo afectan los bots a tu infraestructura?

  1. Consumo de Recursos: Un ataque de bots «hambrientos» puede consumir toda tu CPU y RAM, haciendo que tu web vaya lenta para los humanos reales.
  2. Seguridad: Los bots de «fuerza bruta» prueban miles de contraseñas por segundo en tu SSH o login hasta que encuentran la correcta.
  3. Analítica Falsa: Si no filtras los bots, creerás que tienes 10.000 visitas al día cuando quizás solo 1.000 son clientes reales.

Consejo: mediante diferentes herramientas y estrategias es posible identificar diversos tipos de bots. Así podrás por ejemplo dejar pasar a las arañas de Google pero bloquear a los «scrapers» maliciosos antes de que miren tu base de datos.