Was ist maschinelles Lernen?

Beim maschinellen Lernen handelt es sich um eine Art von Computerprogramm, das lernen kann, Aufgaben ohne konkrete Anweisungen auszuführen.

Lernziele

Nach Lektüre dieses Artikels können Sie Folgendes:

  • Maschinelles Lernen definieren
  • Erklären, wie maschinelles Lernen funktioniert
  • Zwischen Modellen und Algorithmen des maschinellen Lernens unterscheiden

Link zum Artikel kopieren

Was ist maschinelles Lernen?

Maschinelles Lernen bezieht sich auf eine Art statistischer Algorithmen, die ohne konkrete Anweisungen lernen können. Dadurch kann es bestimmte Aufgaben selbstständig erledigen (z. B. Muster erkennen), indem es aus Beispielen verallgemeinert. Maschinelles Lernen ist ein Teil der künstlichen Intelligenz (KI). KI beschreibt die Fähigkeit eines Computers, menschliche kognitive Aktivitäten nachzuahmen.

Maschinelles Lernen hat ein breites Spektrum an Einsatzmöglichkeiten, darunter:

  • Erkennen von E-Mail-Spam
  • Bot-Aktivitäten erkennen
  • Empfehlung von Inhalten für Nutzer auf Streaming-Plattformen und sozialen Netzwerken
  • Bereitstellung von Suchmaschinenergebnissen
  • Sprach- und Bilderkennung
  • Chatbot und Sprachübersetzung
  • Medizinische Forschung

Unterschied zwischen maschinellem Lernen und KI

Maschinelles Lernen und KI sind keine Synonyme; vielmehr fällt maschinelles Lernen als Disziplin unter das Dach der KI. Aber nicht jede KI beinhaltet maschinelles Lernen, da KI auch eine Reihe anderer Fähigkeiten umfassen kann.

Wie funktioniert maschinelles Lernen?

Maschinelles Lernen basiert auf Input und Output. Ein Algorithmus für maschinelles Lernen wird mit Daten (Input) gefüttert, die er verwendet, um ein Ergebnis (Output) zu erzeugen. Ein Modell des maschinellen Lernens „lernt“, welche Art von Ergebnissen es produzieren soll, und es kann dies mit drei Hauptmethoden erreichen:

1. Überwachtes Lernen

Bei der einfachsten Art eines maschinellen Lernprogramms kuratiert der Programmierer eine Reihe von Beispieleingaben sowie den richtigen Output. Der Algorithmus des maschinellen Lernens versucht, aus diesen Beispielen zu verallgemeinern, sodass er, wenn er nur mit dem Input gefüttert wird, den gewünschten Output erzeugen kann.

Stellen Sie sich einen Koch vor, der eine Küche voller Zutaten (Input) erhält und dazu eine Speisekarte mit vielen Beispielen für fertige Gerichte (Output). Indem er die Zutaten auf verschiedene Weise kombiniert und das fertige Produkt mit den Beispielgerichten vergleicht, kann der Koch schließlich die notwendigen Rezepte für die Zubereitung der Gerichte auf der Karte entwickeln. In ähnlicher Weise ermöglicht das überwachte Lernen einem Algorithmus zu lernen, wie er ohne programmierte Anweisungen (oder ein Rezept) die richtigen Ergebnisse erzielt.

2. Unüberwachtes Lernen

Unüberwachtes Lernen bedeutet, dass ein fortgeschrittener Algorithmus für maschinelles Lernen mit Rohdaten gefüttert wird. Dann erkennt er selbständig Muster. Man stelle sich einen Koch vor, der so gut ist, dass er einfach eine Speisekarte durchblättert und sich Rezepte für die Zubereitung der Speisen ausdenkt.

3. Reinforcement Learning oder bestärkendes Lernen

Bei dieser Art des Lernens wird der Algorithmus für maschinelles Lernen durch Feedback trainiert. Es gibt „guten“ Output und „schlechten“ Output, und der Algorithmus lernt mit der Zeit, den schlechten Output zu vermeiden.

Reinforcement Learning ist ein Prozess von Versuch und Irrtum. Stellen Sie sich vor, der Koch hat keine Speisekarte, sondern alles, was er kocht, wird von einem Restaurantkritiker bewertet. Schließlich ist der Koch in der Lage, eine Liste von Gerichten zu erstellen, die dem Kritiker gefallen, nachdem er alle Dinge ausgeschlossen hat, die dem Kritiker nicht gefallen.

Was ist ein Modell für maschinelles Lernen?

Ein Algorithmus ist eine Reihe von vorprogrammierten Schritten; ein Modell für maschinelles Lernen entsteht, wenn ein Algorithmus auf eine Datensammlung angewendet wird. Trotz dieser Unterscheidung werden die Begriffe „Modell für maschinelles Lernen“ und „Algorithmen für maschinelles Lernen“ manchmal synonym verwendet. Der Unterschied ist jedoch wichtig: Zwei Modelle für maschinelles Lernen können unterschiedliche Ergebnisse liefern, selbst wenn sie den gleichen Algorithmus verwenden, solange jedes Modell mit unterschiedlichen Daten als Ausgangspunkt gefüttert wurde.

Was ist Deep Learning?

Deep Learning ist eine Form des maschinellen Lernens. Es verwendet neuronale Netzwerke, um zu lernen, Muster zu erkennen und Assoziationen in unstrukturierten Rohdaten herzustellen. Deep Learning ist unüberwacht und kann extrem komplexe Aufgaben bewältigen. Es wird häufig für Spracherkennung, autonomes Fahren und andere fortschrittliche Anwendungsfälle eingesetzt.

Was ist ein neuronales Netzwerk?

Ein neuronales Netzwerk ist eine Methode des maschinellen Lernens, die die Struktur des menschlichen Gehirns nachahmt. Neuronale Netzwerke bestehen aus Knotenpunkten, die miteinander verbunden sind. Diese Knoten sind auf mindestens drei Schichten verteilt: eine Eingabeschicht, eine Ausgabeschicht und eine oder mehrere verborgene Schichten.

Jede Schicht enthält mehrere Knoten, die miteinander verbunden sind. Wenn ein Knoten Daten als wichtig erachtet, leitet er diese Daten an den nächsten Knoten weiter.

Denken Sie an den Koch, der in der Küche Gerichte zubereitet:

  • Wenn der Koch einen Kuchen backen muss, könnte er zunächst die Zutaten in der Speisekammer prüfen; dies entspricht der Eingabeschicht eines neuronalen Netzwerks.
  • Der Koch wählt Zutaten wie Mehl, Eier, Zucker und Kakaopulver aus. Zutaten wie Hühnerbrühe oder Reis werden dagegen nicht ausgewählt Dies ist wie die Weitergabe statistisch signifikanter Daten an den nächsten Knoten.
  • Der Koch kombiniert die Zutaten auf unterschiedliche Weise. Er mischt den Kuchenteig, stellt den Zuckerguss her und so weiter. Man kann sich das wie die verborgenen Schichten eines neuronalen Netzes vorstellen, in dem die Knoten untereinander Daten austauschen.
  • Zum Schluss backt der Koch den Kuchen, glasiert ihn und serviert ihn; dies ist sozusagen die Ausgabeschicht. Auf dem Weg dorthin wurden irrelevante oder falsche Daten (wie unnötige Zutaten und falsche Mischungen) entfernt.

Was ist eine Vektordatenbank?

Eine Vektordatenbank ist eine Methode zur Speicherung von Daten, die das maschinelle Lernen verbessert. Vektordatenbanken ermöglichen die Suche nach Ähnlichkeiten und die Identifizierung verwandter Objekte, im Gegensatz zu exakten Abfragen. Die Daten auf diese Weise zu speichern, hilft den Modellen des maschinellen Lernens, den Kontext der erhaltenen Eingaben zu verstehen.

Eine Vektordatenbank speichert Elemente in einer Matrix mit verschiedenen Dimensionen und mit Vektoren, die die Position jedes Datenelements entlang dieser Dimensionen angeben. Auf diese Weise können Modelle des maschinellen Lernens Daten in Beziehung zu anderen Daten finden. Eine Streaming-Plattform kann beispielsweise maschinelles Lernen mit einer Vektordatenbank kombinieren, um zu ermitteln, welche Filme einem Zuschauer auf der Grundlage seines bisherigen Nutzungsverhaltens empfohlen werden können.

Welche Herausforderungen gibt es bei der Erstellung von Modellen für maschinelles Lernen?

Ausgehende Daten: Selbst die fortschrittlichsten Deep-Learning-Modelle benötigen Zugang zu umfangreichen Datensätzen, um genaue Ergebnisse zu erzielen. Cloud-Speicher sind ideal für die Speicherung dieser großen Datenmengen, da Cloud-Computing nahezu unbegrenzt skalierbar ist. Für den Zugriff auf diese Daten fallen jedoch häufig Egress-Gebühren an: Gebühren, die Cloud-Anbieter für die Übertragung von Daten aus dem Speicher erheben.

Rechenleistung und Infrastruktur: Maschinelles Lernen, insbesondere Deep Learning, erfordert eine hohe Rechenleistung. Modelle des maschinellen Lernens erfordern den Einsatz spezieller und teurer Hardware oder Cloud-Dienste, z. B. mehrere schnelle, GPU-gesteuerte Server. (Ein GPU oder eine grafische Verarbeitungseinheit ist leistungsfähiger als eine herkömmliche CPU).

Wie hilft Cloudflare Entwicklern beim Aufbau von maschinellem Lernen?

Cloudflare bietet eine Reihe von Diensten an, die es leicht machen, maschinelles Lernen zu nutzen. Cloudflare Workers AI ist ein globales Netzwerk von GPUs, das Entwickler für die Ausführung generativer KI-Aufgaben nutzen können. Cloudflare Vectorize ermöglicht es Entwicklern, eine global verteilte Vektordatenbank zu nutzen. Und Cloudflare R2 ist ein Objektspeicher ohne Gebühren für ausgehenden Traffic, der es Entwicklern erlaubt, große Datensätze in der Cloud zu speichern und diese Daten kostenlos zu übertragen. Erfahren Sie mehr über Cloudflare for AI.