Beim maschinellen Lernen handelt es sich um eine Art von Computerprogramm, das lernen kann, Aufgaben ohne konkrete Anweisungen auszuführen.
Nach Lektüre dieses Artikels können Sie Folgendes:
Link zum Artikel kopieren
Maschinelles Lernen bezieht sich auf eine Art statistischer Algorithmen, die ohne konkrete Anweisungen lernen können. Dadurch kann es bestimmte Aufgaben selbstständig erledigen (z. B. Muster erkennen), indem es aus Beispielen verallgemeinert. Maschinelles Lernen ist ein Teil der künstlichen Intelligenz (KI). KI beschreibt die Fähigkeit eines Computers, menschliche kognitive Aktivitäten nachzuahmen.
Maschinelles Lernen hat ein breites Spektrum an Einsatzmöglichkeiten, darunter:
Maschinelles Lernen und KI sind keine Synonyme; vielmehr fällt maschinelles Lernen als Disziplin unter das Dach der KI. Aber nicht jede KI beinhaltet maschinelles Lernen, da KI auch eine Reihe anderer Fähigkeiten umfassen kann.
Maschinelles Lernen basiert auf Input und Output. Ein Algorithmus für maschinelles Lernen wird mit Daten (Input) gefüttert, die er verwendet, um ein Ergebnis (Output) zu erzeugen. Ein Modell des maschinellen Lernens „lernt“, welche Art von Ergebnissen es produzieren soll, und es kann dies mit drei Hauptmethoden erreichen:
Bei der einfachsten Art eines maschinellen Lernprogramms kuratiert der Programmierer eine Reihe von Beispieleingaben sowie den richtigen Output. Der Algorithmus des maschinellen Lernens versucht, aus diesen Beispielen zu verallgemeinern, sodass er, wenn er nur mit dem Input gefüttert wird, den gewünschten Output erzeugen kann.
Stellen Sie sich einen Koch vor, der eine Küche voller Zutaten (Input) erhält und dazu eine Speisekarte mit vielen Beispielen für fertige Gerichte (Output). Indem er die Zutaten auf verschiedene Weise kombiniert und das fertige Produkt mit den Beispielgerichten vergleicht, kann der Koch schließlich die notwendigen Rezepte für die Zubereitung der Gerichte auf der Karte entwickeln. In ähnlicher Weise ermöglicht das überwachte Lernen einem Algorithmus zu lernen, wie er ohne programmierte Anweisungen (oder ein Rezept) die richtigen Ergebnisse erzielt.
Unüberwachtes Lernen bedeutet, dass ein fortgeschrittener Algorithmus für maschinelles Lernen mit Rohdaten gefüttert wird. Dann erkennt er selbständig Muster. Man stelle sich einen Koch vor, der so gut ist, dass er einfach eine Speisekarte durchblättert und sich Rezepte für die Zubereitung der Speisen ausdenkt.
Bei dieser Art des Lernens wird der Algorithmus für maschinelles Lernen durch Feedback trainiert. Es gibt „guten“ Output und „schlechten“ Output, und der Algorithmus lernt mit der Zeit, den schlechten Output zu vermeiden.
Reinforcement Learning ist ein Prozess von Versuch und Irrtum. Stellen Sie sich vor, der Koch hat keine Speisekarte, sondern alles, was er kocht, wird von einem Restaurantkritiker bewertet. Schließlich ist der Koch in der Lage, eine Liste von Gerichten zu erstellen, die dem Kritiker gefallen, nachdem er alle Dinge ausgeschlossen hat, die dem Kritiker nicht gefallen.
Ein Algorithmus ist eine Reihe von vorprogrammierten Schritten; ein Modell für maschinelles Lernen entsteht, wenn ein Algorithmus auf eine Datensammlung angewendet wird. Trotz dieser Unterscheidung werden die Begriffe „Modell für maschinelles Lernen“ und „Algorithmen für maschinelles Lernen“ manchmal synonym verwendet. Der Unterschied ist jedoch wichtig: Zwei Modelle für maschinelles Lernen können unterschiedliche Ergebnisse liefern, selbst wenn sie den gleichen Algorithmus verwenden, solange jedes Modell mit unterschiedlichen Daten als Ausgangspunkt gefüttert wurde.
Deep Learning ist eine Form des maschinellen Lernens. Es verwendet neuronale Netzwerke, um zu lernen, Muster zu erkennen und Assoziationen in unstrukturierten Rohdaten herzustellen. Deep Learning ist unüberwacht und kann extrem komplexe Aufgaben bewältigen. Es wird häufig für Spracherkennung, autonomes Fahren und andere fortschrittliche Anwendungsfälle eingesetzt.
Ein neuronales Netzwerk ist eine Methode des maschinellen Lernens, die die Struktur des menschlichen Gehirns nachahmt. Neuronale Netzwerke bestehen aus Knotenpunkten, die miteinander verbunden sind. Diese Knoten sind auf mindestens drei Schichten verteilt: eine Eingabeschicht, eine Ausgabeschicht und eine oder mehrere verborgene Schichten.
Jede Schicht enthält mehrere Knoten, die miteinander verbunden sind. Wenn ein Knoten Daten als wichtig erachtet, leitet er diese Daten an den nächsten Knoten weiter.
Denken Sie an den Koch, der in der Küche Gerichte zubereitet:
Eine Vektordatenbank ist eine Methode zur Speicherung von Daten, die das maschinelle Lernen verbessert. Vektordatenbanken ermöglichen die Suche nach Ähnlichkeiten und die Identifizierung verwandter Objekte, im Gegensatz zu exakten Abfragen. Die Daten auf diese Weise zu speichern, hilft den Modellen des maschinellen Lernens, den Kontext der erhaltenen Eingaben zu verstehen.
Eine Vektordatenbank speichert Elemente in einer Matrix mit verschiedenen Dimensionen und mit Vektoren, die die Position jedes Datenelements entlang dieser Dimensionen angeben. Auf diese Weise können Modelle des maschinellen Lernens Daten in Beziehung zu anderen Daten finden. Eine Streaming-Plattform kann beispielsweise maschinelles Lernen mit einer Vektordatenbank kombinieren, um zu ermitteln, welche Filme einem Zuschauer auf der Grundlage seines bisherigen Nutzungsverhaltens empfohlen werden können.
Ausgehende Daten: Selbst die fortschrittlichsten Deep-Learning-Modelle benötigen Zugang zu umfangreichen Datensätzen, um genaue Ergebnisse zu erzielen. Cloud-Speicher sind ideal für die Speicherung dieser großen Datenmengen, da Cloud-Computing nahezu unbegrenzt skalierbar ist. Für den Zugriff auf diese Daten fallen jedoch häufig Egress-Gebühren an: Gebühren, die Cloud-Anbieter für die Übertragung von Daten aus dem Speicher erheben.
Rechenleistung und Infrastruktur: Maschinelles Lernen, insbesondere Deep Learning, erfordert eine hohe Rechenleistung. Modelle des maschinellen Lernens erfordern den Einsatz spezieller und teurer Hardware oder Cloud-Dienste, z. B. mehrere schnelle, GPU-gesteuerte Server. (Ein GPU oder eine grafische Verarbeitungseinheit ist leistungsfähiger als eine herkömmliche CPU).
Cloudflare bietet eine Reihe von Diensten an, die es leicht machen, maschinelles Lernen zu nutzen. Cloudflare Workers AI ist ein globales Netzwerk von GPUs, das Entwickler für die Ausführung generativer KI-Aufgaben nutzen können. Cloudflare Vectorize ermöglicht es Entwicklern, eine global verteilte Vektordatenbank zu nutzen. Und Cloudflare R2 ist ein Objektspeicher ohne Gebühren für ausgehenden Traffic, der es Entwicklern erlaubt, große Datensätze in der Cloud zu speichern und diese Daten kostenlos zu übertragen. Erfahren Sie mehr über Cloudflare for AI.