¿Cómo se construye un bot de Internet?

Más información sobre los componentes básicos de los que está hecho un bot de Internet.

Metas de aprendizaje

Después de leer este artículo podrás:

  • Comprender de forma más concreta qué es un bot y cómo funciona

Contenido relacionado


¿Quieres saber más?

Suscríbete a theNET, el resumen mensual de Cloudflare sobre las ideas más populares de Internet.

Revisa la política de privacidad de Cloudflare para saber más sobre cómo Cloudflare gestiona tus datos personales.

Copiar el enlace del artículo

¿Qué significa "bot"?

Un bot de Internet es un programa informático que se ejecuta en una red. Los bots están programados para realizar automáticamente determinadas acciones, como rastrear páginas web, chatear con los usuarios o intentar entrar en cuentas de usuarios.

A diferencia de los robots industriales que se utilizan en fábricas, o de los "robots de batalla" construidos por los aficionados a la robótica, un bot es en realidad unas pocas líneas de código con una base de datos. Otra forma de decirlo es que un bot de Internet es un conjunto de instrucciones para ordenadores, además de una colección de información. La mayoría de los bots tienen un diseño bastante sencillo, pero algunos son más complejos y utilizan la inteligencia artificial (IA) para intentar imitar el comportamiento humano.

Escribir un bot es bastante sencillo para la mayoría de los desarrolladores, y a veces incluso para los que no son desarrolladores. Esta es una de las razones por las que los bots están tan extendidos por Internet. En algunos casos, ni siquiera es necesario escribir líneas de código reales para crear un bot; por ejemplo, Twitter proporciona una interfaz visual para que los usuarios creen bots que tuiteen, retuiteen, den "me gusta" y realicen otras acciones en la red social.

¿Cuáles son los principales componentes de un bot de Internet?

La arquitectura de un bot suele incluir lo siguiente:

  • Lógica de la aplicación
  • Base de datos
  • Integraciones de API

La lógica de la aplicación es el código ejecutable, legible por la máquina, que el desarrollador del bot escribe y un ordenador ejecuta. El ejemplo anterior del código del bot conversacional entra en esta categoría.

La base de datos es la colección de datos de la que se nutre el bot para saber qué acciones tiene que realizar. Un bot puede guardar información adicional en su base de datos, como cuando un bot de apropiación de sitios web descarga contenido de un sitio web.

Las API permiten al bot utilizar funcionalidades externas sin que el desarrollador tenga que escribirlas. Todo lo que el desarrollador tiene que hacer es añadir los comandos adecuados en el código, y el bot llamará a una API según sea necesario.

(Una API es una forma de incorporar una funcionalidad de software compleja que alguien ya ha creado. Pensemos que una API es como una forma de evitar que haya que "reinventar la rueda" al programar una aplicación. Por ejemplo, un bot conversacional podría utilizar la API de una aplicación meteorológica para proporcionar a los usuarios que lo soliciten información detallada sobre el tiempo. De este modo, el bot conversacional no necesita hacer un seguimiento del tiempo por sí mismo, sino que se limita a llamar a la API de una aplicación meteorológica externa).

A diferencia de las aplicaciones con las que los usuarios están más acostumbrados a interactuar, la mayoría de los bots no tienen una interfaz de usuario. Esto es debido a que los bots en Internet suelen interactuar con páginas web, aplicaciones y API, no con los usuarios (aunque pueden interactuar con los usuarios mediante el chat, redes sociales y otros canales).

¿Cómo pueden los sitios web y las aplicaciones hacer frente al tráfico de bots excesivo?

Ya que los bots son relativamente sencillos de crear, son extremadamente comunes en Internet: aproximadamente la mitad de todo el tráfico de Internet procede de bots, tanto de bots beneficiosos como de bots perjudiciales.

Algunos bots, como los bots rastreadores web y los bots conversacionales, son fundamentales para que Internet funcione correctamente y para que los usuarios encuentren la información que necesitan. Sin embargo, un tráfico de bots excesivo puede sobrecargar los servidores de origen de una propiedad web, y los bots maliciosos pueden llevar a cabo diversos ciberataques. Para evitar esto, los sitios y las aplicaciones web pueden utilizar de forma estratégica los archivos robots.txt, implementar limitación de velocidad y aprovechar las soluciones de gestión de bots.

¿Quieres profundizar en el desarrollo de bots? Consulta esta entrada del blog sobre cómo escribir un bot conversacional sin servidor.