¿Qué es el Protocolo de Contexto de Modelo (MCP)?

El Protocolo de Contexto de Modelo (MCP) permite a los agentes de IA acceder a herramientas y fuentes de datos externas para que puedan actuar de forma más eficaz.

Objetivos de aprendizaje

Después de leer este artículo podrás:

  • Entender la función del Protocolo de Contexto de Modelo (MCP) en la IA agéntica
  • Explicar cómo funciona MCP
  • Identificar los desafíos relacionados con la seguridad en MCP

Copiar enlace del artículo

¿Qué es el Protocolo de Contexto de Modelo (MCP)?

El Protocolo de Contexto de Modelo es una forma estándar de poner la información a disposición de los modelos lingüísticos de gran tamaño (LLM). De forma similar al funcionamiento de una interfaz de programación de aplicaciones (API), MCP ofrece un método documentado y estandarizado para que un programa informático pueda integrar servicios de una fuente externa. Es compatible con la IA agéntica (programas inteligentes que pueden seguir objetivos y actuar de forma autónoma).

MCP, básicamente, permite que los programas de IA superen su entrenamiento. Les permite incorporar nuevas fuentes de información en su proceso de toma de decisiones y generación de contenido, y les ayuda a conectarse a herramientas externas.

Imagina un asistente que necesita hacer una reserva para su jefe en un restaurante. El asistente llamará al número de teléfono del restaurante, preguntará qué horarios tienen disponibles y solicitará una mesa. MCP es una forma de proporcionar un "número de teléfono" a los agentes de IA para que puedan obtener la información que necesitan para llevar a cabo las tareas.

MCP lo desarrolló la empresa de IA Anthropic y posteriormente pasó a ser de código abierto. Desde ese momento, a finales de 2024, MCP se ha convertido rápidamente en un estándar del sector, y esto permite un uso más generalizado de los agentes de IA.

¿Qué son los agentes de IA?

Los agentes de IA son programas de IA basados en LLM. Utilizan las capacidades de procesamiento de información de los LLM para obtener datos, tomar decisiones y actuar en nombre de los usuarios humanos.

MCP es una forma de que los agentes de IA encuentren la información que necesitan y realicen acciones. Ayuda a conectar a los agentes de IA con el "mundo exterior", por así decirlo, el mundo más allá de los datos de entrenamiento del LLM. (Otros métodos incluyen las integraciones API y la navegación sin interfaz gráfica.)

¿Cómo funciona MCP?

MCP es un protocolo, es decir, un conjunto acordado de pasos e instrucciones para su uso entre diversos dispositivos informáticos conectados a la red. MCP supone una arquitectura cliente-servidor, en la que una entidad, el cliente (el agente de IA o un programa subsidiario) envía solicitudes a los servidores, que responden.

Los clientes MCP operan dentro de los hosts MCP. Los clientes mantienen una conexión individual con los servidores MCP, pero se pueden ejecutar varios clientes desde el mismo host MCP. Por lo tanto, los hosts MCP pueden extraer simultáneamente datos de varios servidores MCP. Los servidores MCP, a su vez, pueden utilizar las integraciones API para obtener datos de fuentes adicionales.

Es decir, un agente de IA puede utilizar MCP para conectarse a varios servidores a la vez. Sin embargo, cada conexión se realiza independientemente de las demás. Pensemos en un equipo de reporteros de un periódico, que se ponen en contacto con las fuentes de información a nivel individual, pero luego reúnen su información para producir una noticia.

Mensajes MCP

En MCP se utilizan cuatro tipos de mensajes:

  • Solicitudes: el cliente (contenido dentro del host) solicita información a un servidor MCP.
  • Resultados: el servidor MCP responde con la información deseada.
  • Errores: se envían cuando el servidor no puede dar una respuesta.
  • Notificaciones: mensajes unidireccionales que no necesitan respuesta (como un anuncio de servicio público). Los puede enviar el cliente o el servidor.

Conexiones MCP remotas y locales

Las conexiones MCP pueden ser remotas o locales. Las conexiones remotas tienen lugar entre los agentes de IA y los servidores MCP a través de Internet. Las conexiones locales se producen dentro de la misma máquina (los clientes MCP y los servidores MCP son programas de software que se ejecutan por separado).

Pasos en una conexión MCP

Las comunicaciones de red MCP constan de tres fases:

  1. Inicialización: el cliente envía el primer mensaje, y en la breve serie de mensajes subsiguientes el cliente y el servidor acuerdan las versiones del protocolo.
  2. Intercambio de mensajes: se intercambian solicitudes, resultados y notificaciones.
  3. Terminación: el cliente o el servidor finaliza la conexión con un mensaje "close()".

Para que MCP sea más seguro, es posible que se lleven a cabo pasos adicionales de autenticación y autorización antes de estas tres fases.

¿Qué es un servidor MCP?

Un servidor MCP es un programa alojado en un servidor o en la nube que expone capacidades para que los agentes de IA las utilicen a través de MCP. Los servidores MCP pueden proporcionar a los agentes de IA acceso a nuevos conjuntos de datos u otras herramientas que necesiten. Por ejemplo, un servidor MCP podría permitir que un agente de IA utilizara un servicio de correo electrónico, con el objetivo de que el agente pueda enviar correos electrónicos en nombre del usuario humano al que está ayudando.

¿MCP es seguro?

MCP no tiene las funciones de autenticación, autorización o encriptación integradas de forma nativa, por lo que los desarrolladores tienen que implementarlas ellos mismos o utilizar un servicio que les ayude con la implementación.

MCP no requiere el uso de HTTPS, sino que se ejecuta sobre HTTP en muchas implementaciones. Por lo tanto, puede carecer de encriptación y autenticación a menos que los desarrolladores implementen de forma proactiva el uso de Transport Layer Security (TLS). MCP, como cualquier protocolo de red, puede ser vulnerable a la suplantación o a ataques en ruta si no se utiliza TLS.

Debido a que MCP ofrece una funcionalidad similar a una API (partes externas que solicitan datos y servicios), muchas de las principales consideraciones sobre la seguridad de las API también se aplican a las implementaciones de MCP. Las organizaciones que ofrecen servidores MCP deben asegurarse de que los datos confidenciales no queden expuestos, de que los recursos estén protegidos, de que la limitación de velocidad impida un número excesivo de solicitudes, de que los agentes de IA no tengan demasiados permisos, y de que las entradas se validen y saneen.

Algunos servidores MCP ofrecen bibliotecas para facilitar la implementación de OAuth. Cloudflare proporciona una biblioteca de proveedores OAuth que implementa el lado del proveedor del protocolo OAuth 2.1, lo que te permite añadir fácilmente la función de autorización a tu servidor MCP.

Los desarrolladores pueden utilizar esta biblioteca de proveedores OAuth de tres maneras:

  • La integración directa con un proveedor OAuth externo
  • La integración con su propio proveedor OAuth, incluidos los proveedores de autorización como servicio
  • Un Cloudflare Worker (función sin servidor implementada en la red de Cloudflare) gestiona la autorización, mientras que un servidor MCP que se ejecuta en Cloudflare gestiona todo el flujo de OAuth.

Cloudflare pone a disposición de los desarrolladores varios servidores MCP que crean IA agéntica. Cloudflare también permite a los desarrolladores crear e implementar sus propios servidores MCP para la compatibilidad con los agentes de IA. Descubre cómo empezar a utilizar MCP en Cloudflare.