Qu'est-ce que l'apprentissage en profondeur (Deep learning) ?

L'apprentissage en profondeur est un type d'apprentissage automatique puissant capable de traiter des données non étiquetées et de reconnaître des logiques. L'apprentissage en profondeur est à la base de nombreux types d'IA.

Objectifs d’apprentissage

Cet article s'articule autour des points suivants :

  • Définir l'apprentissage en profondeur
  • Faire la différence entre l'apprentissage en profondeur et l'apprentissage automatique
  • Comprendre l'apprentissage non supervisé, les réseaux neuronaux et les données non étiquetées

Copier le lien de l'article

Qu'est-ce que l'apprentissage en profondeur (Deep learning) ?

L'apprentissage en profondeur est un type d'apprentissage automatique qui permet de reconnaître des logiques complexes et de faire des associations comment le feraient les humains. Ses capacités peuvent aller de l'identification d'éléments sur une photo ou de la reconnaissance d'une voix à la conduite d'une voiture ou à la création d'une illustration. Un modèle d'apprentissage en profondeur est avant tout un programme informatique qui peut faire preuve d'intelligence, grâce à une technique de traitement des données complexe et sophistique.

L'apprentissage en profondeur est une forme d'intelligence artificielle (IA), et il est au cœur du fonctionnement de nombreux services et modèles d'IA. Les grands modèles de langage (LLM) tels que ChatGPT, Bard et Bing Chat, et les générateurs d'images tels que Midjourney et DALL-E, s'appuient sur l'apprentissage en profondeur pour apprendre le langage et le contexte, et pour produire des réponses réalistes. Les modèles d'IA prédictive utilisent l'apprentissage en profondeur pour tirer des conclusions à partir de collections tentaculaires de données historiques.

Comment fonctionne l'apprentissage en profondeur ?

Généralement, pour qu'un programme informatique produise des sorties correctes, il est nécessaire de lui fournir des fournir des données d'entrées précises. Avec l'apprentissage en profondeur, en revanche, des données arbitraires ou imprécises permettent d'obtenir des résultats opportuns. Par exemple, un programme informatique traditionnel peut être capable de déterminer si deux portraits numériques sont exactement identiques. Un modèle d'apprentissage en profondeur quant à lui repère des similitudes entre les sujets des portraits, même si les portraits eux-mêmes sont différents.

L'apprentissage en profondeur s'appuie sur de grands ensembles de données et une puissance de calcul importante. Ces deux éléments étant devenus de plus en plus largement disponibles, les modèles d'apprentissage en profondeur sont devenus plus sophistiqués. Aujourd'hui, les collectes de données massives et les services informatiques cloud reposant sur des processeurs graphiques rendent l'apprentissage en profondeur plus accessible que jamais aux développeurs et aux utilisateurs quotidiens.

Quelle est la différence entre l'apprentissage automatique et l'apprentissage en profondeur ?

L'apprentissage automatique est un type de programme informatique capable d'apprendre sans instructions explicites. L'apprentissage en profondeur est un type spécialisé d'apprentissage automatique, tout comme un jet est un type spécialisé d'avion. Dans les deux cas, il s'agit de laisser un programme informatique apprendre par lui-même à partir d'un ensemble de données. Cependant, l'apprentissage en profondeur peut faire plus, tout comme un avion à réaction est plus puissant qu'un avion à hélice ou qu'un planeur.

L'apprentissage en profondeur peut également apprendre à partir de données non étiquetées, tandis que les modèles d'apprentissage automatique plus basiques ont besoin de plus de contexte sur les données qu'ils reçoivent pour « apprendre » correctement. Enfin, les modèles d'apprentissage en profondeur sont créés à l'aide de réseaux neuronaux. Certains modèles d'apprentissage automatique sont développés sur des réseaux neuronaux, mais ce n'est pas le cas de tous.

Comment l'apprentissage en profondeur est-il utilisé ?

Les applications de l'apprentissage en profondeur sont actuellement déjà très nombreuses sans compter celles qui continuent d'être découvertes. Les cas d'utilisation actuels sont les suivants :

  • Assistants vocaux
  • Voitures autonomes
  • Modèles prédictifs
  • Création d'images
  • Traitement du langage naturel
  • Chatbots d'IA conversationnelle
  • Recherche médicale

Qu'est-ce que l'apprentissage non supervisé ?

Dans le domaine de l'apprentissage automatique, l'apprentissage non supervisé est un moyen d'identifier des logiques et des associations dans un grand ensemble de données sans aucun contexte concernant le contenu de l'ensemble de données. L'apprentissage supervisé quant à lui fournit des exemples d'entrées et de sorties à un modèle. L'apprentissage en profondeur peut se servir de l'apprentissage supervisé pour entraîner des modèles, mais sa capacité à apprendre sans supervision le distingue des autres types d'apprentissage automatique.

Imaginons un modèle d'apprentissage automatique alimenté par des exemples d'articles de presse, avec une mention indiquant le sujet traité par chaque article. Après un entraînement suffisant, ce modèle peut être capable « d'écrire » un article sur un sujet donné. Il s'agit de l'apprentissage supervisé.

Imaginons maintenant un modèle d'apprentissage en profondeur alimenté par une série d'exemples d'articles de presse, sans aucune indication sur le sujet de chaque article. Un tel modèle, s'il est suffisamment puissant, est capable de rédiger un article sur un sujet donné, avec pour seule entrée le sujet. Il s'agit de l'apprentissage non supervisé.

Qu'est-ce qu'une donnée non étiquetée ?

Les données non étiquetées sont des données dépourvues de classifications, de balises ou d'étiquettes. Les ensembles de données non étiquetées peuvent contenir des données arbitraires et se présenter sous n'importe quelle forme : photos aléatoires, compilations vidéo, longues listes de noms de fichiers, données de journal, ou une combinaison de tout ce qui précède. Les articles de presse fournis sans contexte (dans l'exemple précédent) sont un exemple de données non étiquetées.

Les modèles d'apprentissage en profondeur sont capables de contextualiser et de « comprendre » les données non étiquetées. En règle générale, plus ils sont alimentés en données, plus les modèles deviennent sophistiqués.

Stockage de données et d'objets non étiquetés

Les données non étiquetées sont souvent non structurées. Les données non structurées ne suivent aucun format particulier et peuvent donc contenir n'importe quel type d'information numérique. Le stockage d'objets est souvent utilisé pour sauvegarder des données non structurées de ce type. Ces collections de données peuvent croître indéfiniment et le stockage d'objets est un moyen très évolutif et relativement rentable de les stocker.

Les modèles d'apprentissage en profondeur gagnent en efficacité lorsqu'ils disposent de vastes collections de données à partir desquelles ils peuvent apprendre, même lorsque ces données ne sont ni étiquetées ni structurées. Le stockage d'objets est donc une ressource importante pour les modèles d'apprentissage en profondeur.

Qu'est-ce qu'un réseau neuronal ?

Un réseau neuronal est un type d'architecture d'apprentissage automatique basé sur le fonctionnement du cerveau humain. Les réseaux neuronaux sont une collection de nœuds ; chaque nœud correspond à sa propre unité de traitement. Les données statistiquement significatives sont transmises d'un nœud à l'autre.

Ces nœuds sont répartis sur au moins trois couches : une couche d'entrée, une couche cachée et une couche de sortie. Chaque couche comporte généralement plusieurs nœuds. Il peut y avoir plusieurs couches cachées, et les modèles d'apprentissage en profondeur ont tendance à en avoir beaucoup.

Envisagez le réseau neuronal comme une équipe collaborant à la résolution d'un problème. Chaque membre de l'équipe est responsable d'un aspect du problème, et une fois sa tâche accomplie, il passe le relais au membre suivant de l'équipe. Enfin, l'équipe parvient ensemble à une solution complète.

Les réseaux neuronaux existent depuis des décennies, mais l'apprentissage en profondeur moderne utilise plus de couches que les réseaux neuronaux du passé. Les modèles d'apprentissage en profondeur d'aujourd'hui ont également accès à une puissance de calcul et à des volumes de données bien plus importants que jamais, ce qui permet aux développeurs d'accélérer les progrès de la technologie de l'IA.

Quelle contribution Cloudflare apporte-t-elle à la création de modèles d'apprentissage en profondeur ?

Cloudflare permet aux développeurs de créer facilement des applications d'intelligence artificielle accessibles depuis n'importe où avec un temps de latence minimal. Cloudflare Workers AI donne accès à des processeurs graphiques serverless sur le réseau mondial de Cloudflare pour l'exécution de modèles d'apprentissage automatique avancés. Et Cloudflare R2 est une solution de stockage objet sans frais de trafic sortant qui propose un stockage plus rentable de grands ensembles de données utilisable pour entraîner des modèles d'apprentissage en profondeur.

En savoir plus sur Cloudflare for AI.