¿Qué es aprendizaje profundo?

El aprendizaje profundo es un potente tipo de aprendizaje automático que puede procesar datos no etiquetados y reconocer patrones. El aprendizaje profundo es fundamental para muchos tipos de AI.

Objetivos de aprendizaje

Después de leer este artículo podrás:

  • Definir el aprendizaje profundo
  • Diferenciar entre aprendizaje profundo y aprendizaje automático
  • Comprender el aprendizaje no supervisado, las redes neuronales y los datos no etiquetados

Copiar enlace del artículo

¿Qué es aprendizaje profundo?

El aprendizaje profundo es un tipo de aprendizaje automático que puede reconocer patrones complejos y hacer asociaciones de forma similar a los humanos. Sus capacidades pueden ir desde identificar objetos en una foto o reconocer una voz hasta conducir un coche o crear una ilustración. Esencialmente, un modelo de aprendizaje profundo es un programa informático que puede mostrar inteligencia, gracias a su enfoque complejo y sofisticado del procesamiento de datos.

El aprendizaje profundo es un tipo de inteligencia artificial (AI), y es fundamental para el funcionamiento de muchos servicios y modelos de AI. Los grandes modelos lingüísticos (LLM), como ChatGPT, Bard y Bing Chat, y los generadores de imágenes, como Midjourney y DALL-E, se basan en el aprendizaje profundo para aprender el lenguaje y el contexto, y producir respuestas realistas. Los modelos de AI predictiva utilizan el aprendizaje profundo para obtener conclusiones a partir de extensas colecciones de datos históricos.

¿Cómo funciona el aprendizaje profundo?

Normalmente, el uso de un programa informático requiere entradas precisas para obtener las salidas correctas. El aprendizaje profundo, en cambio, puede tomar datos arbitrarios o imprecisos y producir un resultado relevante. Por ejemplo, un programa informático tradicional podría saber si dos retratos digitales son exactamente iguales. Un modelo de aprendizaje profundo podría ser capaz de reconocer similitudes en los sujetos del retrato, aunque los retratos en sí sean diferentes.

El aprendizaje profundo se basa en grandes conjuntos de datos y mucha potencia de cálculo, y a medida que ha aumentado la disponibilidad de estas dos cosas, los modelos de aprendizaje profundo se han vuelto más sofisticados. Hoy en día, las colecciones de big data y los servicios de informática en la nube potenciados por la GPU hacen que el aprendizaje profundo sea más accesible que nunca para los desarrolladores y los usuarios asiduos.

¿Cuál es la diferencia entre aprendizaje automático y aprendizaje profundo?

El aprendizaje automático es un tipo de programa informático que puede aprender sin instrucciones explícitas. El aprendizaje profundo es un tipo especializado de aprendizaje automático, igual que un jet es un tipo especializado de avión. Ambos implican dejar que un programa informático aprenda por sí mismo a partir de un conjunto de datos. Sin embargo, el aprendizaje profundo puede hacer más, igual que un reactor es más potente que un avión de hélice o un planeador.

El aprendizaje profundo también puede aprender de datos no etiquetados, mientras que los modelos de aprendizaje automático más básicos pueden necesitar más contexto sobre los datos que se les suministran para "aprender" correctamente. Por último, los modelos de aprendizaje profundo se construyen utilizando redes neuronales. Los modelos de aprendizaje automático pueden basarse en redes neuronales, pero no siempre es así.

¿Cómo se utiliza el aprendizaje profundo?

El aprendizaje profundo ya tiene una plétora de aplicaciones en el mundo actual, y se siguen descubriendo nuevos usos. Los casos de uso actuales incluyen:

  • Asistentes de voz
  • Coches autónomos
  • Modelos predictivos
  • Creación de imágenes
  • Procesamiento del lenguaje natural
  • AI conversacional de bot de chat
  • Investigación médica

¿Qué es el aprendizaje no supervisado?

En el campo del aprendizaje automático, el aprendizaje no supervisado es una forma de identificar patrones y asociaciones en un gran conjunto de datos sin ningún contexto sobre lo que contiene el conjunto de datos. En cambio, el aprendizaje supervisado proporciona entradas y salidas de ejemplo a un modelo. El aprendizaje profundo puede utilizar el aprendizaje supervisado para entrenar modelos, pero su capacidad para aprender sin supervisión lo diferencia de otros tipos de aprendizaje automático.

Imagina que un modelo de aprendizaje automático recibe ejemplos de artículos de noticias, con una indicación del tema sobre el que trata cada artículo. Tras un entrenamiento suficiente, este modelo podría ser capaz de "escribir" un artículo sobre un tema determinado. Esto es aprendizaje supervisado.

Ahora, imagina que se alimenta a un modelo de aprendizaje profundo con una serie de artículos de noticias de ejemplo, sin ninguna orientación sobre el tema de cada artículo. Un modelo de este tipo, si es lo suficientemente potente, podría ser capaz de escribir un artículo sobre un tema determinado, con solo el tema proporcionado como entrada. Esto es el aprendizaje no supervisado.

¿Qué son los datos no etiquetados?

Los datos no etiquetados son datos sin clasificaciones, etiquetas o rótulos. Los conjuntos de datos sin etiquetar pueden contener cualquier dato arbitrario y adoptar cualquier forma: fotos aleatorias, recopilaciones de vídeo, largas listas de nombres de archivos, datos de registro o una combinación de todo lo anterior. Los artículos de noticias proporcionados sin contexto (del ejemplo anterior) serían un ejemplo de datos no etiquetados.

Los modelos de aprendizaje profundo son capaces de contextualizar y "comprender" datos no etiquetados. Y normalmente, cuantos más datos se les suministran, más sofisticados se vuelven los modelos.

Almacenamiento de datos y objetos sin etiquetar

Los datos no etiquetados también suelen estar desestructurados. Los datos no estructurados no siguen ningún formato concreto, por lo que pueden contener cualquier tipo de información digital. El almacenamiento de objetos se utiliza a menudo para guardar datos no estructurados de este tipo. Estas colecciones de datos pueden crecer indefinidamente, y el almacenamiento de objetos es una forma altamente escalable y bastante rentable de almacenarlos.

Los modelos de aprendizaje profundo se vuelven más eficaces cuando se les dan grandes colecciones de datos de los que aprender, incluso cuando esos datos no están etiquetados ni estructurados. El almacenamiento de objetos es, por lo tanto, un recurso importante para los modelos de aprendizaje profundo.

¿Qué es una red neuronal?

Una red neuronal es un tipo de arquitectura de aprendizaje automático basada en el funcionamiento del cerebro humano. Las redes neuronales son una colección de nodos; cada nodo es su propia unidad de procesamiento. Los datos estadísticamente significativos pasan de un nodo a otro.

Estos nodos están repartidos en al menos tres capas: una capa de entrada, una capa oculta y una capa de salida. Normalmente hay varios nodos en cada capa. Puede haber varias capas ocultas, y los modelos de aprendizaje profundo suelen tener muchas.

Piensa en una red neuronal como en un equipo que trabaja conjuntamente para resolver un problema. Cada miembro del equipo es responsable de un aspecto del problema, y una vez cumplida su función, lo traspasa al siguiente miembro del equipo. Finalmente, el equipo llega junto a una solución completa.

Las redes neuronales existen desde hace décadas, pero el aprendizaje profundo actual utiliza más capas que las redes neuronales del pasado. Los modelos de aprendizaje profundo actuales también tienen acceso a mucha más potencia de cálculo y datos que nunca, lo que permite a los desarrolladores acelerar el avance de la tecnología de AI.

¿Cómo permite Cloudflare la construcción de modelos de aprendizaje profundo?

Cloudflare ayuda a los desarrolladores a crear fácilmente aplicaciones de AI a las que se pueda acceder desde cualquier lugar con una latencia mínima. Cloudflare Workers AI proporciona acceso a GPU sin servidor en la red global de Cloudflare para ejecutar modelos avanzados de aprendizaje automático. Y Cloudflare R2 es un almacenamiento de objetos sin tasas de salida para un almacenamiento más rentable de grandes conjuntos de datos, que pueden utilizarse para entrenar modelos de aprendizaje profundo.

Más información sobre Cloudflare for AI.