¿Qué es un agente de IA?

Un agente de IA es un programa informático impulsado por inteligencia artificial que puede realizar de forma autónoma tareas complejas en nombre de usuarios humanos.

Metas de aprendizaje

Después de leer este artículo podrás:

  • Definir la IA agéntica
  • Describe cómo funcionan los agentes de IA
  • Entender cómo los agentes de IA toman medidas

Copiar el enlace del artículo

¿Qué es un agente de IA?

Un agente de IA es un programa informático impulsado por inteligencia artificial (IA) que puede realizar tareas de forma autónoma para ayudar a los usuarios humanos, incluso sin instrucciones definidas. A diferencia de otro software impulsado por IA, como los bots de chat, los agentes de IA pueden operar fuera de un contexto específico en función de indicaciones. Pueden salir de sus datos de entrenamiento y echar un vistazo al mundo, por así decirlo, para encontrar información. Luego, pueden, por su cuenta, tomar medidas en función de esa información en busca de un objetivo más amplio.

Los agentes de IA pueden tomar decisiones, aprender de experiencias anteriores y adaptar sus acciones a la situación.Incluso pueden consultar con otros agentes de IA para obtener información relevante. Los seres humanos establecen objetivos para los agentes de IA, pero depende de los agentes descubrir cómo lograrlos. Pueden operar de forma independiente o con muy poca intervención humana.

Los agentes de IA pueden alimentar el hardware (como en la robótica) u operar solo en el software.

IA agéntica vs. agentes de IA

Los agentes de IA son los programas de software que se describen anteriormente: toman decisiones y manejan tareas por su cuenta. La IA agéntica es el campo del desarrollo de IA que permite la creación de agentes de IA. (Piensa en la diferencia entre la IA generativa y los grandes modelos lingüísticos individuales, como Microsoft Copilot, o la diferencia entre "cocinar" y una comida específica).

IA agéntica vs. IA generativa

La IA generativa (GenAI) hace referencia a un tipo de modelo de aprendizaje profundo que puede generar contenido en respuesta a instrucciones. Es la categoría de IA a la que pertenecen los LLM como ChatGPT. La IA agéntica se basa en la IA generativa. Pero mientras que un LLM solo puede responder a las instrucciones a través de una interfaz de usuario o API específicas, un agente de IA puede salir de un contexto definido y realizar acciones incluso sin instrucciones.

Un ejecutivo de ventas de una gran empresa podría dar instrucciones a un modelo lingüístico de gran tamaño (LLM) al decir: "Escribe un correo electrónico que pueda enviar a 10 de nuestros principales clientes, invitándolos a una cena". Pero con la IA agéntica, el ejecutivo podría dar instrucciones a un agente de IA diciendo: "Invita a cenar a 10 de nuestros principales clientes". En otras palabras, el LLM puede generar texto, pero el agente de IA es capaz de generar el texto del correo electrónico, encontrar a los 10 clientes más importantes en un CRM y enviar invitaciones personalizadas por correo electrónico al evento (siempre que tenga los permisos suficientes para hacerlo).

¿Cómo funcionan los agentes de IA?

Modelos lingüísticos de gran tamaño (LLM)

Los agentes de IA se basan en los LLM. Un LLM es un tipo de modelo de IA que se ha entrenado con grandes conjuntos de datos de muestra, lo que le permite comprender el contenido creado por humanos y generar contenido propio. Los LLMs entienden incluso las instrucciones y solicitudes humanas imprecisas.

Debido a que se basan en los LLM, los agentes de IA pueden procesar e interpretar una amplia variedad de datos y contenido, desde solicitudes conversacionales de los usuarios hasta contenido de video alojado en la web. Los agentes de IA pueden interpretar el contenido de múltiples tipos de medios: código, texto, audio, video, etc. Luego, pueden usar lo que aprenden de ese contenido para perfeccionar sus acciones.

Integraciones e interacciones externas

Además, los agentes de IA tienen formas de interactuar con el mundo. En robótica, esto puede incluir sensores físicos y cámaras. Para los agentes de IA solo de software, esto puede adoptar varias formas:

  • Los agentes pueden conectarse directamente a aplicaciones externas a través de las API
  • Algunos agentes de IA pueden interactuar con las aplicaciones web como un usuario humano, completando formularios, leyendo páginas web, etc. (pueden utilizar un navegador sin interfaz gráfica para este fin)
  • Un estándar emergente llamado protocolo Model Context (MCP) conecta a los agentes de IA con una variedad de herramientas (clientes de correo electrónico, CRM, sistemas de facturación, etc.) con la autenticación y autorización adecuadas permitidas para el agente

Estas formas de interactuar con el mundo fuera del contexto del entorno del agente de IA permiten que el agente de IA tome medidas. Las organizaciones pueden establecer medidas de seguridad para los agentes de IA con el fin de garantizar que las acciones que realizan sean correctas, al igual que los usuarios humanos pueden tener permisos limitados dentro de un entorno informático. Además de programar políticas en los agentes de IA, las organizaciones también pueden emplear un enfoque con participación humana activa, donde estos verifican la precisión de las respuestas de los agentes de IA o aprueban las acciones de los agentes.

Aprendizaje a través del ciclo de retroalimentación de datos

Los agentes de IA también pueden aprender utilizando los resultados de acciones anteriores y los aportes de usuarios humanos para perfeccionar sus acciones en el futuro. Tienen "memoria", no solo en el sentido computacional de RAM, sino en el sentido de recordar interacciones y resultados anteriores. Este aprendizaje ocurre a través de un ciclo de retroalimentación que se conoce como ciclo de retroalimentación de datos: el modelo subyacente utiliza los registros de las interacciones de un agente para mejorar el rendimiento futuro.

¿Cuáles son los tipos de agentes de IA?

Hay dos tipos principales de agentes de IA:

  • Agentes en segundo plano: realizan tareas, especialmente rutinarias, en segundo plano, con poca interacción del usuario. Los agentes en segundo plano son como conserjes o trabajadores de mantenimiento cuya tarea es conservar la oficina limpia y las luces encendidas.
  • Agentes de superficie: interactúan más directamente con los usuarios humanos. Los bots de chat, el servicio de atención al cliente y los agentes asistentes de IA se encuentran en esta categoría. Los agentes de superficie son como los recepcionistas en un edificio de oficinas, que interactúan con las personas que ingresan y cumplen ciertas tareas según sea necesario.

También hay sistemas de agente único y de agentes múltiples. Los sistemas de IA de agente único se basan en un solo modelo. Los sistemas de IA de agentes múltiples combinan las funciones de varios agentes que se consultan entre sí para resolver problemas.

¿Qué es un bot de chat de IA agéntica?

Los bots de chat de IA agéntica, al igual que los bots de chat tradicionales, pueden interactuar en conversaciones con las personas. Sin embargo, los bots de chat de IA agéntica pueden salir de su contexto de bot de chat — abandonar el chat — y tomar medidas en nombre de la persona con la que están interactuando. Un bot de chat tradicional podría brindar instrucciones sobre cómo presentar un ticket de soporte. Un bot de chat de IA agéntica podría incluso presentar el ticket.

Bots de chat de IA agéntica vs. bots de chat de IA no agéntica

Los bots de chat de IA no agéntica son reactivos y responden a las instrucciones del usuario de acuerdo con sus datos de entrenamiento. Es posible que sigan funcionando con un LLM, pero son mejores para brindar a los usuarios contenido o instrucciones útiles que para realizar acciones en nombre de los usuarios. Los bots de chat de IA agéntica pueden actuar fuera del contexto de su interacción con un usuario. Los bots de chat de IA agéntica también pueden aprender de una variedad de fuentes más allá de sus datos de entrenamiento.

¿Cómo admite Cloudflare a la IA agéntica?

La plataforma para desarrolladores de Cloudflare ofrece todas las herramientas necesarias para crear e implementar agentes basados en IA que pueden hacer lo siguiente:

  • Realizar tareas de forma autónoma
  • Comunicarse con los clientes en tiempo real
  • Ejecutar los modelos de IA
  • Navegar por la web
  • Consultar una base de datos
  • Admitir interacciones con intervención humana en el proceso

Además, la red global de Cloudflare permite a los desarrolladores crear agentes de IA con código que se ejecuta en cualquier parte del mundo, lo más cerca posible de los usuarios finales. Descubre cómo empezar a crear agentes de IA en Cloudflare.