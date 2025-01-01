La nueva Política de Indicaciones de Contenido permitirá a los propietarios y editores de sitios web declarar preferencias sobre cómo las empresas de IA acceden y utilizan su contenido, disponible de forma totalmente gratuita

San Francisco, CA, 24 de septiembre de 2025 – Cloudflare, Inc. (NYSE: NET), la empresa líder en conectividad cloud, presentó hoy su última solución para ayudar a los propietarios y editores de sitios web a tener más control sobre su contenido. Cloudflare facilitará para cualquier propietario de un sitio web actualizar su archivo robots.txt, el archivo de texto simple que indica a las arañas web a qué partes de un sitio pueden o no acceder, con una nueva Política de Indicaciones de Contenido. Esta nueva política permitirá a los operadores de sitios web expresar preferencias sobre cómo otros utilizan sus datos, incluida la posibilidad de excluirse de las descripciones e inferencias de IA.

Internet está cambiando de "motores de búsqueda", que proporcionaban un mapa del tesoro de enlaces que un usuario podía explorar en busca de información, a "motores de respuesta" impulsados por IA, que dan una respuesta directa sin que el usuario tenga que hacer clic en el contenido del sitio original. Esto amenaza gravemente el modelo de negocio original de Internet, en el que los sitios web, los editores y los creadores de contenido podían ganar dinero o fama al atraer tráfico y visitas a su sitio. Hoy en día, los rastreadores de IA extraen grandes cantidades de datos de los sitios web, pero los operadores de sitios web no tienen forma de expresar los matices de si, cómo y con qué propósito podrían querer permitir que se utilice su contenido. Los archivos robots.txt permiten a los operadores de sitios web especificar qué rastreadores están permitidos y a qué partes de un sitio web pueden acceder. Sin embargo, no permite que el rastreador sepa lo que puede hacer con el contenido después de acceder a él. Tiene que haber una forma estándar, legible por máquina, de indicar cómo se pueden utilizar los datos incluso después de que se haya accedido a ellos.

"Internet no puede esperar una solución mientras el contenido original de los creadores es utilizado por otras empresas con fines de lucro", afirmó Matthew Prince, cofundador y director general de Cloudflare. "Para garantizar que la web siga siendo abierta y próspera, ofrecemos a los propietarios de sitios web una mejor manera de expresar cómo las empresas pueden utilizar su contenido. Robots.txt es un recurso de poco uso que podemos ayudar a fortalecer, y dejar en claro a las empresas de IA que ya no pueden ignorar las preferencias de un creador de contenido".

Cloudflare cree que un operador de un sitio web, API, servidor MCP o cualquier servicio conectado a Internet, ya sea una organización de noticias local, una empresa emergente de IA o una tienda de comercio electrónico, deberían poder decidir cómo otros utilizan sus datos con fines comerciales. En la actualidad, más de 3,8 millones de dominios utilizan el servicio robots.txt administrado de Cloudflare para expresar que no quieren que su contenido se utilice para entrenamiento. Ahora, la nueva Política de Indicaciones de Contenido de Cloudflare permitirá a los usuarios reforzar sus preferencias de robots.txt con un conjunto claro de instrucciones para cualquiera que acceda al sitio web a través de medios automatizados, como un rastreador de IA. La política ahora informará a los rastreadores de la siguiente manera:

Explicar cómo interpretar las indicaciones de contenido en términos sencillos: "Sí" significa permitido, "no" significa no permitido, y sin indicación significa que no se ha expresado ninguna preferencia.

Definir las diferentes formas en que un rastreador suele utilizar el contenido en términos claros, incluida la búsqueda, la entrada de IA y el entrenamiento de IA.

Recordar a las empresas que las preferencias de los operadores de sitios web en los archivos robots.txt pueden tener un significado legal.

Si bien es posible que los archivos robots.txt no detengan la apropiación no deseada, el objetivo de Cloudflare es que este lenguaje de política mejorado comunique mejor las preferencias del propietario de un sitio web a los operadores de bots, y que impulse a las empresas a respetar más las preferencias de los creadores de contenido.

A partir de hoy, Cloudflare actualizará automáticamente los archivos robots.txt para incluir este nuevo lenguaje de políticas para todos los clientes que permitan a Cloudflare gestionar su archivo robots.txt. Para cualquier persona que quiera declarar cómo los rastreadores pueden usar su contenido a través de archivos robots.txt personalizados, Cloudflare está publicando herramientas que ayudaran a lograrlo.

Las organizaciones han visto la necesidad de soluciones como la Política de Indicaciones de Contenido, como una forma de ofrecer más orientación sobre cómo se utiliza su contenido:

News/Media Alliance: "Estamos encantados de que Cloudflare ofrezca una nueva y eficaz herramienta, ahora ampliamente disponible para todos los usuarios, para que los editores especifiquen cómo y dónde se utiliza su contenido. Este es un paso importante para empoderar a las editoriales de todos los tamaños para que recuperen el control sobre su propio contenido y garantizar que puedan seguir financiando la creación de contenido de calidad en el que confían los usuarios. Esperamos que esto anime a las empresas tecnológicas a respetar las preferencias de los creadores de contenido. Cloudflare está demostrando que hacer lo correcto no solo es posible, sino que es un buen negocio". – Danielle Coffey, presidenta y directora general de News/Media Alliance

