Cloudflare mejora la plataforma de inferencia de IA con una potente actualización de GPU, inferencia más rápida, modelos más grandes, capacidad de observación y una base de datos vectorial mejorada
Workers AI es el entorno más fácil para desarrollar y escalar aplicaciones de IA. Ahora se pueden implementar modelos más grandes y gestionar tareas de IA más complejas
San Francisco, CA, 26 de septiembre de 2024 – Cloudflare, Inc. (NYSE: NET), la empresa líder en conectividad cloud, hoy anunció funciones nuevas y más potentes de Workers AI, la plataforma de IA sin servidor, y su paquete de bloques de desarrollo de aplicaciones de IA, para ayudar a los desarrolladores a crear más rápido aplicaciones de IA más potentes y con mejor rendimiento. Las aplicaciones desarrolladas en Workers AI ahora se benefician de una inferencia más rápida, modelos más grandes, mejores análisis de rendimiento y más. Workers AI es la plataforma en la que resulta más fácil desarrollar aplicaciones de IA a nivel global y ejecutar inferencias de IA cerca del usuario, independientemente del lugar del mundo en donde se encuentre.
A medida que los modelos lingüísticos de gran tamaño (LLM) se achican y tienen un mejor rendimiento, las velocidades de la red constituirán un cuello de botella para la adopción del cliente y las interacciones de IA eficientes. La red distribuida a nivel global de Cloudflare ayuda a minimizar la latencia de la red, diferenciándose de otras redes que generalmente están formadas por recursos concentrados en centros de datos limitados. La plataforma de inferencia sin servidor de Cloudflare, Workers AI, ahora tiene GPU en más de 180 ciudades en todo el mundo. Está desarrollada para ofrecer accesibilidad a nivel global y baja latencia a los usuarios finales de todo el mundo. Con esta red de GPU, Workers AI tiene una de las mayores presencias en cuanto a plataforma de IA a nivel global. Además, se ha diseñado para ejecutar inferencias de IA a nivel local, lo más cerca posible del usuario, y para tener los datos de los clientes más cerca de estos.
“Cuando el año pasado se lanzó la IA, nadie pensaba que las velocidades de las redes eran el motivo de la latencia de IA, porque aún era una interacción novedosa y experimental. Pero a medida que la IA se integra cada vez más a nuestras vidas diarias, la red y los milisegundos importan", comentó Matthew Prince, cofundador y director general de Cloudflare. “A medida que las cargas de trabajo de IA cambian de entrenamiento a inferencia, el rendimiento y la disponibilidad regional van a ser fundamentales para respaldar la siguiente etapa de la IA. Cloudflare es la plataforma de IA más global del mercado, y tener GPU en ciudades de todo el mundo es lo que hará que la IA pase de ser un juguete novedoso a formar parte de nuestras vidas diarias, al igual que lo fue Internet para los teléfonos inteligentes”.
Cloudflare también presenta nuevas funciones que la convierten en la plataforma en donde se pueden desarrollar más fácilmente aplicaciones de IA con lo siguiente:
- Rendimiento mejorado y compatibilidad con modelos más grandes: ahora Cloudflare mejora su red global con GPU más potentes para que Workers AI actualice el rendimiento de inferencia de IA y ejecute inferencia en modelos significativamente más grandes como Llama 3.1 70B, y la colección de modelos Llama 3.2 con 1B, 3B, 11B (y pronto 90B). Al admitir modelos más grandes, tiempos de respuesta más rápidos y ventanas de contexto más grandes, las aplicaciones de IA desarrolladas en Workers AI de Cloudflare pueden gestionar tareas más complejas con mayor eficiencia – y generar de esta manera experiencias del usuario naturales y eficientes.
- Mejor monitoreo y optimización del uso de IA con registros persistentes: los nuevos registros persistentes en AI Gateway, disponibles en la versión beta abierta, permiten a los desarrolladores almacenar las indicaciones de los usuarios y las respuestas del modelo por períodos más extendidos para analizar y comprender mejor cómo funciona su aplicación. Con los registros persistentes, los desarrolladores pueden obtener información más detallada de las experiencias de los usuarios, incluso el costo y la duración de las solicitudes, para ayudar a ajustar su aplicación. Más de dos mil millones de solicitudes han pasado por AI Gateway desde su lanzamiento el año pasado.
- Consultas más rápidas y asequibles: las bases de datos vectoriales permiten que los modelos recuerden más fácilmente entradas previas y que el aprendizaje automático se use para potenciar la búsqueda, las recomendaciones y los casos de uso de generación de texto. La base de datos vectorial de Cloudflare, Vectorize, ahora está disponible, y a partir de agosto de 2024 admite índices de hasta cinco millones de vectores cada una, previamente admitía 200 000. La latencia promedio de las consultas ahora es de 31 milisegundos (ms), comparada con 549 ms. Estas mejoras permiten que las aplicaciones de IA busquen rápidamente información relevante con menos procesamiento de datos, lo que también significa más aplicaciones de IA asequibles.
Para obtener más información, consulta los siguientes recursos:
- Blog: La plataforma de inteligencia artificial más grande, mejor y más rápida de Cloudflare
- Blog: Hacer que Workers AI sea más rápida y eficiente: optimización del rendimiento con compresión de caché KV y decodificación especulativa
- Únete a nosotros en línea para demostraciones, anuncios de productos y más en nuestra primera transmisión en directo de Builder Day el 26 de septiembre a las 11 a. m. PT. Inscríbete en https://builderday.pages.dev.
Acerca de Cloudflare
Cloudflare, Inc. (NYSE: NET) es la empresa líder en conectividad cloud cuya misión es ayudar a crear un mejor servicio de Internet. Ayuda a las organizaciones a aumentar la velocidad y mejorar la seguridad de sus empleados, aplicaciones y redes en todas partes, al tiempo que reduce la complejidad y los costos. La conectividad cloud de Cloudflare ofrece la plataforma más completa y unificada de productos nativos en la nube y herramientas para desarrolladores, de manera que cualquier organización pueda obtener el control que necesita para trabajar, desarrollar y acelerar su negocio.
Cloudflare, que utiliza una de las redes más grandes e interconectadas del mundo, bloquea por día miles de millones de amenazas en línea para sus clientes. Millones de organizaciones confían en Cloudflare, desde las marcas más importantes, emprendedores y pequeñas empresas hasta organizaciones sin fines de lucro, grupos humanitarios y gobiernos de todo el mundo.
Si deseas obtener más información sobre la conectividad cloud de Cloudflare, visita cloudflare.com/connectivity-cloud. Para conocer las nuevas tendencias y perspectivas de Internet, consulta https://radar.cloudflare.com.
Síguenos en: Blog | X | LinkedIn | Facebook | Instagram
Proyecciones futuras
Este comunicado de prensa contiene proyecciones futuras en el sentido de la Sección 27A de la Ley de Valores de 1933, y sus modificaciones, y la Sección 21E de la Ley de Intercambio de Valores de 1934, y sus modificaciones, que implican riesgos e incertidumbres sustanciales. En algunos casos, se pueden identificar proyecciones futuras porque contienen palabras como "puede", "será", "debería", "espera", "explora", "planea", "anticipa", "podría", "tiene la intención", "objetivo", "proyecto", "contempla", "cree", "estima", "predice", "potencial" o "continúa", o la forma negativa de estas palabras, u otros términos o expresiones similares que se refieren a las expectativas, estrategia, planes o intenciones de Cloudflare. Sin embargo, no todas las proyecciones contienen estas palabras identificativas. Las proyecciones futuras expresas o implícitas en este comunicado de prensa incluyen, a modo enunciativo pero no limitativo, afirmaciones con respecto a las funciones y a la eficacia de Workers AI, AI Gateway, Vectorize, R2 y otros productos y tecnologías de Cloudflare, los beneficios para los clientes al usar Workers AI, AI Gateway, Vectorize, R2 y otros productos y tecnología de Cloudflare, los plazos en los que Workers AI, AI Gateway, Vectorize, R2 o algunas de sus funciones relacionadas estarán disponibles para todos los clientes actuales y potenciales de Cloudflare, el desarrollo tecnológico, las operaciones futuras, el crecimiento, las iniciativas o las estrategias de Cloudflare, y comentarios hechos por el director general de Cloudflare y otros. Los resultados reales podrían diferir materialmente de los declarados o implícitos en las proyecciones futuras debido a una serie de factores, que incluyen, entre otros, los riesgos detallados en las presentaciones de Cloudflare ante la Comisión de Valores y Bolsa (SEC), el Informe Trimestral de Cloudflare en el Formulario 10-Q presentado el 1 de agosto de 2024, así como otras presentaciones que Cloudflare haga de vez en cuando ante la SEC.
Las proyecciones futuras incluidas en este comunicado de prensa se refieren solo a los acontecimientos que se produzcan en la fecha en que se realizan. Cloudflare no asume obligación alguna de publicar actualizaciones de las proyecciones futuras hechas en este comunicado de prensa para reflejar eventos o circunstancias posteriores a la fecha del mismo o para reflejar nueva información o cualquier otra posible circunstancia no prevista, salvo que lo exija la ley. Quizá Cloudflare no logre los planes, las intenciones o las expectativas que se revelan en nuestras declaraciones de proyecciones futuras, y no se debe confiar plenamente en las mismas.
© 2024 Cloudflare, Inc. Todos los derechos reservados. Cloudflare, su logotipo y otras marcas de Cloudflare son marcas comerciales o marcas registradas de Cloudflare, Inc. en Estados Unidos y otras jurisdicciones. Todas las demás marcas y nombres mencionados en este documento pueden ser marcas comerciales de sus respectivos propietarios.