Cloudflare renforce sa plateforme d'inférence IA grâce à des GPU plus puissants, à une inférence plus rapide, à des modèles de plus grande taille, à une meilleure observabilité et à une mise à jour de sa base de données vectorielle
La plateforme Workers AI est le moyen le plus simple de développer et de faire évoluer des applications IA. Elle peut désormais déployer des modèles de plus grande taille et traiter des tâches IA plus complexes
Paris, le 26 septembre 2024 — Cloudflare, Inc. (NYSE : NET), le leader dans le domaine du cloud de connectivité, annonce de puissantes fonctionnalités pour Workers AI, la plateforme IA serverless, et sa suite de composants pour applications IA afin d'aider les développeurs à concevoir des applications IA plus rapides et plus performantes. Les applications développées sur Workers AI peuvent désormais bénéficier d'une inférence plus rapide, de modèles de plus grande taille, d'outils d'analyse des performances améliorées et de bien d'autres avantages. La plateforme Workers AI est le moyen le plus simple de développer des applications IA mondiales et d'exécuter des tâches d'inférence IA à proximité des utilisateurs, peu importe où ils se trouvent dans le monde.
Lorsque les grands modèles linguistiques (LLM) réduiront en taille et gagneront en performances, la vitesse des réseaux deviendra le goulot d'étranglement en termes d'adoption par les clients et d'interactions fluides avec l'IA. Le réseau mondialement distribué de Cloudflare contribue à minimiser la latence réseau. Il se place donc à part des autres réseaux, généralement composés de ressources concentrées dans un nombre limité de datacenters. Workers AI, la plateforme d'inférence serverless de Cloudflare, dispose désormais de GPU dans plus de 180 villes à travers le monde. En outre, elle a été spécialement conçue à des fins d'accessibilité mondiale, afin de proposer un temps de latence faible aux utilisateurs finaux, où qu'ils se trouvent. Grâce à ce réseau de GPU, Workers AI présente l'une des plus larges empreintes internationales parmi les plateformes IA et peut exécuter des tâches d'inférence IA aussi près de l'utilisateur que possible, tout en permettant de conserver les données des clients au plus proche.
« Lorsque l'IA a pris son essor l'année dernière, personne ne considérait la vitesse des réseaux comme une raison à la latence des modèles, car il s'agissait encore d'une interaction nouvelle et expérimentale. Toutefois, à mesure que nous nous rapprochons du stade où l'IA deviendra une partie intégrante de nos activités quotidiennes, le réseau et les millisecondes prendront leur importance », explique Matthew Prince, cofondateur et CEO de Cloudflare. « Lorsque les tâches IA passeront de l'entraînement à l'inférence, les performances et la disponibilité régionale s'avéreront essentielles pour soutenir la prochaine phase de la technologie. Cloudflare propose la plateforme IA la plus mondialisée du marché. Le fait de disposer de GPU dans un grand nombre de villes à travers le monde constituera le marchepied qui permettra de sortir l'IA de son statut de nouveau jouet pour intégrer pleinement nos vies, tout comme un Internet plus rapide l'a permis pour les smartphones. »
Cloudflare lance également de nouvelles fonctionnalités qui en font la plateforme la plus simple à utiliser pour développer des applications IA :
- Performances améliorées et prise en charge de modèles de plus grande taille : Cloudflare renforce désormais son réseau mondial à l'aide de GPU plus puissants afin que Workers AI puissent bénéficier de meilleures performances en termes d'inférence IA et exécute des tâches d'inférence sur des modèles de plus grande taille, comme Llama 3.1 70B, mais aussi la collection de modèles Llama 3.2 avec les versions 1B, 3B et 11B (et bientôt 90B). Grâce à la prise en charge de modèles de plus grande taille, à des temps de réponse plus rapide et à des fenêtres de contexte plus vastes, les applications IA développées sur la plateforme Workers AI de Cloudflare peuvent traiter des tâches plus complexes avec une meilleure efficacité afin de donner lieu à une expérience naturelle et fluide pour l'utilisateur final.
- Surveillance améliorée et optimisation de l'utilisation de l'IA grâce aux journaux persistants : les nouveaux journaux persistants d'AI Gateway, disponibles en bêta ouverte, permettent aux développeurs de stocker les invites (prompts) des utilisateurs et les réponses des modèles pendant de longues périodes afin de leur permettre de mieux analyser et comprendre la manière dont leur application se comporte. Grâce aux journaux persistants, les développeurs peuvent bénéficier d'informations plus détaillées sur l'expérience de leurs utilisateurs, notamment en termes de coût et de durée des requêtes, afin de les aider à affiner leur application. Plus de deux millions de requêtes ont transité par AI Gateway depuis son lancement l'année dernière.
- Requêtes plus rapides et plus abordables : les bases de données vectorielles permettent aux modèles de se souvenir plus facilement des entrées précédentes, afin d'autoriser l'usage de l'apprentissage automatique (Machine Learning) dans les scénarios d'utilisation de recherche avancée, de recommandations et de génération de texte. Vectorize, la base de données vectorielle de Cloudflare, est désormais en disponibilité générale et prend désormais en charge, depuis août 2024, les index de jusqu'à cinq millions de vecteurs chacun, contre 20 000 précédemment. La latence médiane des requêtes est désormais réduite à 31 millisecondes (ms) par rapport aux 549 ms précédentes. Ces améliorations permettent aux applications IA de trouver rapidement des informations pertinentes au prix d'un traitement de données moindre, une caractéristique qui ouvre également la porte à des applications IA plus abordables.
Pour en savoir plus, n'hésitez pas à consulter les ressources suivantes :
- Blog : La plateforme d'IA de Cloudflare : plus vaste, plus performante et plus rapide
- Blog : Rendre Workers AI plus rapide et plus efficace : optimisation des performances grâce à la compression et au décodage spéculatif du cache de KV
- Rejoignez-nous pour plus de démos, d'annonces de produits et d'autres événements lors de notre première diffusion en direct du Builder Day aujourd'hui, le 26 septembre, à 11 h UTC-7. Inscrivez-vous sur https://builderday.pages.dev.
À propos de Cloudflare
Cloudflare, Inc. (NYSE : NET), le leader dans le domaine du cloud de connectivité, s'est donné pour mission de contribuer à bâtir un Internet meilleur. Nous fournissons aux entreprises tous les moyens nécessaires pour rendre leurs collaborateurs, leurs applications et leurs réseaux plus rapides et plus sûrs, partout dans le monde, tout en réduisant la complexité et les coûts. Le cloud de connectivité Cloudflare propose la plateforme unifiée la plus complète en matière de produits et d'outils de développement cloud-native, permettant à toutes les entreprises de bénéficier des mesures de contrôle dont elles ont besoin pour travailler, développer et dynamiser leur activité.
Reposant sur l'un des réseaux les plus vastes et les plus interconnectés du monde, Cloudflare bloque chaque jour des milliards de menaces en ligne pour le compte de ses clients. Des millions d'entreprises et d'organisations nous font confiance, des plus grandes marques aux entrepreneurs individuels et aux PME, en passant par les organismes à but non lucratif, les groupes d'assistance humanitaire et les administrations du monde entier.
Pour en apprendre davantage sur le cloud de connectivité Cloudflare, rendez-vous sur cloudflare.com/fr-fr/connectivity-cloud. Pour découvrir les nouvelles tendances et informations concernant Internet, rendez-vous sur https://radar.cloudflare.com.
Suivez-nous : Blog | X | LinkedIn | Facebook | Instagram
Déclarations prospectives
Le présent communiqué de presse contient des déclarations prospectives au sens de la section 27A de la loi Securities Act de 1933, dans sa version modifiée, et de la section 21E de la loi Securities Exchange Act de 1934, dans sa version modifiée, lesquelles déclarations comportent des incertitudes et risques substantiels. Dans certains cas, les déclarations prospectives peuvent être identifiées par la présence de mots tels que « peut », « sera », « devrait », « s'attend à », « étudie », « planifie », « prévoit », « pourrait », « a l'intention de », « vise », « projette », « envisage », « considère », « estime », « prédit », « potentiel » ou « continue » ou de la forme négative de ces mots ou d'autres termes ou expressions similaires concernant les attentes, la stratégie, les plans ou les intentions de Cloudflare. Toutes les déclarations prospectives ne contiennent cependant pas les termes identificateurs suscités. Les déclarations prospectives exprimées ou sous-entendues dans le présent communiqué de presse comprennent, sans s'y limiter, les déclarations concernant les capacités et l'efficacité de Workers AI, AI Gateway, Vectorize et R2, ainsi que des autres produits et technologies Cloudflare, les avantages liés à l'utilisation de Workers AI, AI Gateway, Vectorize et R2, ainsi que des autres produits et technologies Cloudflare, pour les clients Cloudflare, la date de mise en disponibilité générale de Workers AI, AI Gateway, Vectorize et R2, ainsi que des autres produits et technologies Cloudflare, le développement technologique, les opérations, la croissance, les initiatives ou les stratégies futures de Cloudflare, les futures tendances du marché, de même que les commentaires formulés par le CEO de Cloudflare et d'autres personnes. Les résultats réels peuvent différer sensiblement des résultats énoncés ou sous-entendus dans les déclarations prospectives en raison d'un certain nombre de facteurs, notamment, sans s'y limiter, les risques détaillés dans les documents déposés par Cloudflare auprès de la Securities and Exchange Commission (SEC), comme notre rapport annuel sur formulaire 10-Q déposé le 1er août 2024, ainsi que d'autres documents susceptibles d'être déposés ponctuellement par Cloudflare auprès de la SEC.
Les déclarations prospectives effectuées dans le présent communiqué de presse concernent uniquement les événements survenus à la date à laquelle sont effectuées lesdites déclarations. Cloudflare ne s'engage aucunement à mettre à jour les déclarations prospectives contenues dans le présent communiqué de presse afin de refléter des événements ou des circonstances postérieurs à la date du présent communiqué de presse ou de refléter de nouvelles informations ou la survenue d'événements imprévus, sauf dans les cas prévus par la loi. Cloudflare peut ne pas parvenir à concrétiser réellement les plans, intentions ou attentes divulgués dans ses déclarations prospectives et le lecteur ne devrait donc pas se fier indûment à ces déclarations.
© 2024 Cloudflare, Inc. Tous droits réservés. Cloudflare, le logo Cloudflare et les autres marques Cloudflare sont des marques commerciales et/ou des marques déposées de Cloudflare, Inc. aux États-Unis et dans d'autres juridictions. Tous les autres noms et marques mentionnés dans le présent document peuvent être des marques commerciales de leurs propriétaires respectifs.