L'intelligence artificielle générative (IA) est un type de programme informatique capable de produire du contenu en réponse à des invites provenant d'utilisateurs humains.
Cet article s'articule autour des points suivants :
Copier le lien de l'article
L'intelligence artificielle (IA) générative est un type de modèle d'apprentissage en profondeur qui peut produire du texte, des images, du code informatique et du contenu audiovisuel en réponse à des invites.
Les modèles d'IA générative sont entraînés sur de grandes quantités de données brutes, en général, des données de mêmes types que celles qu'ils sont censés produire. À partir de ces données, ils apprennent à formuler des réponses statistiquement susceptibles d'être pertinentes pour les données arbitraires qui leur ont été données. Par exemple, certains modèles d'IA générative sont entraînés sur de grandes quantités de texte, afin d'être capable de répondre à des demandes écrites dans un style en apparence naturel et original.
En termes plus simples, l'IA générative peut réagir aux demandes comme le font les artistes ou les auteurs humains, mais plus rapidement. La question de savoir si le contenu généré par ces modèles peut être considéré comme « nouveau » ou « original » n'est pas tranchée, mais dans de nombreux cas, ils peuvent égaler ou dépasser certaines capacités créatives humaines.
Parmi les modèles d'IA générative les plus populaires, citons ChatGPT pour la génération de texte et DALL-E pour la génération d'images. De nombreuses organisations ont également élaboré leurs propres modèles.
L'IA générative est un type d'apprentissage automatique, ce qui signifie qu'elle s'appuie sur l'analyse mathématique pour trouver des concepts, images ou logiques pertinents.Elle utilise ensuite cette analyse pour produire un contenu qui est statistiquement susceptible d'être similaire ou lié à l'invite qu'elle a reçue.
Plus précisément, l'IA générative s'appuie sur un type d'apprentissage automatique appelé apprentissage en profondeur. Les modèles d'apprentissage en profondeur sont suffisamment puissants pour apprendre à partir de données non étiquetées. Ils utilisent un type d'architecture informatique appelé réseau neuronal. Ces architectures sont composées de plusieurs nœuds qui se transmettent des données, de la même manière qu'un cerveau humain transmet des données par l'intermédiaire de neurones. Les réseaux neuronaux sont capables d'effectuer des tâches très sophistiquées et raffinées.
Les modèles d'IA générative capables d'interpréter le langage doivent comprendre plus que des mots isolés. Ils doivent être capables d'interpréter des phrases, des paragraphes et des documents entiers. Les premiers modèles d'apprentissage automatique avaient du mal à comprendre des phrases entières et « oubliaient » le début d'une phrase lorsqu'ils en atteignaient la fin, ce qui donnait lieu à des erreurs d'interprétation.
Les modèles d'IA générative modernes utilisent un type spécifique de réseaux neuronaux appelés transformateurs. Ces derniers exécutent une fonctionnalité appelée auto-attention pour détecter la manière dont les éléments d'une séquence sont connectés. Les transformateurs permettent aux modèles d'IA générative de traiter et de contextualiser de grands blocs de texte plutôt que des mots et des phrases isolés.
Pour fonctionner correctement, les modèles d'IA générative doivent recevoir une grande quantité de données : plus de données, dans la plupart des cas, qu'un être humain ne pourrait en traiter au cours de sa vie. Par exemple, le grand modèle de langage ChatGPT a été entraîné sur des millions de documents. Un générateur d'images peut être entraîné sur des millions d'images, et un générateur de code sur des milliards de lignes de code.
Ces données d'entraînement sont stockées dans une base de données vectorielle. Dans une telle base de données, les points de données sont stockés sous forme de vecteurs, c'est-à-dire un ensemble de coordonnées dans un champ multidimensionnel. Tout comme la latitude et la longitude permettent à quelqu'un de trouver des lieux proches sur une carte, le stockage des données sous forme de vecteurs permet aux modèles d'apprentissage automatique de trouver « des points de données proches ». Cela permet aux modèles de faire des associations et de comprendre le contexte d'un mot, d'une image, d'un son ou de tout autre type de contenu.
Une fois que le modèle d'IA générative a atteint un certain niveau de précision, il n'a plus besoin d'autant de données pour produire un résultat. Par exemple, les modèles d'IA générateurs de voix peuvent être entraînés sur des milliers d'heures d'enregistrements vocaux. Mais une fois qu'ils sont bien réglés, certains modèles n'ont besoin que de quelques secondes d'un échantillon d'enregistrement pour imiter de manière réaliste la voix d'une personne.
Les modèles d'IA générative sont de plus en plus populaires, car ils présentent un certain nombre d'avantages potentiels. Ces prestations comprennent, entre autres, les éléments suivants :
Cependant, l'IA générative présente certains inconvénients, notamment :
« Grand modèle de langage (LLM) » est le terme technique désignant les modèles génératifs d'IA qui traitent le langage et peuvent générer du texte, y compris les langues humaines et les langages de programmation. Les LLM les plus populaires sont ChatGPT (de OpenAI), Llama (de Meta), Bard (de Google), Copilot (de GitHub) et Bing Chat (de Microsoft).
Les générateurs d'images d'IA fonctionnent de la même manière que les LLM, mais pour des images au lieu de textes. DALL-E et Midjourney sont deux exemples de générateurs d'images populaires basés sur l'IA générative.
Cloudflare permet aux développeurs et aux entreprises de créer leurs propres modèles d'IA générative. Cloudflare propose Vectorize aux développeurs afin qu'ils puissent générer et stocker des intégrations sur le réseau mondial de Cloudflare à partir de leurs propres données, et Cloudflare Workers AI pour qu'ils exécutent des tâches d'IA générative sur un réseau mondial de processeurs graphiques. En savoir plus sur la façon dont Cloudflare permet la prochaine génération d'IA générative.