Was ist KI-Bildgenerierung?

KI-Bildgeneratoren können detaillierte Bilder in verschiedenen Stilen auf der Grundlage großer Mengen von Trainingsdaten erzeugen.

Lernziele

Nach Lektüre dieses Artikels können Sie Folgendes:

  • Verstehen, wie KI-Bildgenerierung funktioniert
  • Neuronale Netzwerke und Generative Adversarial Networks beschreiben
  • Erfahren, wie Cloudflare Entwicklern beim Aufbau von KI-Bildgeneratoren hilft

Link zum Artikel kopieren

Wie funktioniert KI-Bildgenerierung?

Die Bildgenerierung mit künstlicher Intelligenz (KI) ist eine Art der generativen KI zur Erstellung von visuellen Inhalten. Dabei werden mithilfe mathematischer Analysen Muster in Fotos und Abbildungen identifiziert und dupliziert. Einfacher ausgedrückt: KI-Bildgeneratoren erstellen Bilder basierend auf einer Reihe von Beispielen.

KI-Bildgeneratoren basieren auf einem speziellen Modell des maschinellen Lernens, dem so genannten neuronalen Netzwerk. Durch fortgeschrittene statistische Analysen und einige Feinabstimmung seitens des Entwicklers können Bildgeneratoren relevante, detaillierte Bilder in einer Vielzahl von Stilen erzeugen.

Ein KI-Bildgenerator ähnelt weniger einem Künstler mit einem Pinsel als einem Glücksspieler, der Sportwetten abschließt. Die von ihm erstellten Inhalte erfüllen statistisch gesehen wahrscheinlich die Anfrage, die er erhalten hat. Und die erstellten Inhalte basieren auf bereits vorhandenen Inhalten, ganz so wie ein Wettender die früheren Leistungen von Sportlern analysiert, bevor er seine Wette platziert.

KI-Bildgeneratoren können realistisch wirkende Fotos erstellen. Sie können auch bereits vorhandene Bilder bearbeiten. Wie andere Arten der generativen KI können KI-Modelle zur Bilderzeugung Prompts in natürlicher Sprache interpretieren und als Reaktion darauf Bilder erstellen. „Erstelle ein Bild von einem Elefanten“ ist ein gültiger Prompt – auch wenn er noch etwas verfeinert werden muss, bevor das Bild erzeugt wird, das der Nutzer im Kopf hat.

Was ist generative KI?

Generative KI ist eine Kategorie von Deep Learning-Modellen, die Text, Bilder, Computercode, Audio- oder visuelle Inhalte erzeugen. Als eine Form des maschinellen Lernens stützt es sich auf die mathematische und statistische Analyse von Stichprobendatensätzen, um Inhalte zu erzeugen, die mit statistischer Wahrscheinlichkeit für Antworten auf Prompts relevant sind. Mit anderen Worten: Generative KI erstellt schnell Inhalte auf der Grundlage früherer Beispiele.

Welche Technologie steckt hinter der KI-Bildgenerierung?

Wie oben beschrieben, wird die KI-Bildgenerierung mit Hilfe von maschinellem Lernen aufgebaut, einer Klasse von fortgeschrittenen Computerprogrammen, die ohne konkrete Anweisungen lernen können. Insbesondere basiert die KI-Bilderzeugung auf neuronalen Netzwerken.

Ein neuronales Netzwerk ist eine Art von Deep Learning-Computing-Architektur. Im Wesentlichen versuchen neuronale Netze, die Struktur des menschlichen Gehirns nachzuahmen. Es handelt sich dabei um eine Ansammlung von Verarbeitungseinheiten, die als „Knoten“ bezeichnet werden. Die „Knoten“ tauschen Daten untereinander aus, ähnlich wie im menschlichen Gehirn, wo Neuronen elektrische Impulse aneinander senden.

Es gibt viele verschiedene Klassen von neuronalen Netzwerken im Bereich der KI. Die spezielle Art von neuronalem Netzwerk, die von den meisten bildgenerierenden KI-Modellen verwendet wird, wird als Generative Adversarial Network (GAN) bezeichnet. Ein GAN hat zwei Arbeitsabläufe: Einer erzeugt Bilder, und der andere vergleicht diese Bilder mit realen Beispielen und identifiziert Fehler. So kann sich ein GAN-basiertes Modell selbst trainieren und kontinuierlich verbessern. Stellen Sie sich einen Maler vor, der lernt, indem er berühmte Bilder aus der Vergangenheit nachahmt und seine Arbeit mit den Originalen vergleicht.

Wie unterscheidet sich die KI-Bildgenerierung von anderen Arten der generativen KI?

Während für verschiedene Arten generativer KI die gleichen oder ähnliche Algorithmen verwendet werden können, werden bildgenerierende Modelle mit visuellen Bildersätzen trainiert, im Gegensatz zu großen Textmengen wie bei ChatGPT und anderen Large Language Models (LLMs).

Was sind KI-Bildhalluzinationen?

KI-Halluzinationen können bei jeder Art von generativem KI-Modell auftreten, und bildgenerierende KI ist da keine Ausnahme. Dies führt zu Ungenauigkeiten im Bild: Wird z. B. ein Porträt angefordert, erscheint an der Hand der abgebildeten Person gerne mal ein zusätzlicher Finger. Mit genügend Prompting und Verfeinerung lassen sich solche Halluzinationen in der Regel beseitigen.

Sind KI-generierte Bilder urheberrechtlich geschützt?

Jede von Menschen geschaffene kreative Leistung unterliegt dem Urheberrecht, es sei denn, der Urheber hat auf das Urheberrecht verzichtet oder das Urheberrecht ist abgelaufen. Die Rechte an einem Werk können mittels einer Lizenz an andere Parteien übertragen oder verkauft werden.

Bildlizenzen lassen sich in mehrere Stufen unterteilen:

  • Ohne wiederkehrende Lizenzkosten: Diese Bilder können nach einer einmaligen Zahlung an den Rechteinhaber beliebig verwendet werden.
  • Urheberrechtsfrei: Ein solches Bild wurde für die Öffentlichkeit freigegeben und kann von allen für jeden Zweck verwendet werden, ohne dass der Urheber genannt werden muss.
  • Public Domain: Ein kreatives Werk ist in der Public Domain, wenn das Urheberrecht abgelaufen ist. Jeder kann Public Domain-Bilder für jeden Zweck verwenden. Werke gehen in verschiedenen Ländern zu unterschiedlichen Zeiten in die Public Domain über, sodass die internationale Nutzung dieser Bilder schwierig sein kann.
  • Creative Commons: Es gibt sechs verschiedene Arten von Lizenzen in dieser Kategorie. Alle erlauben die weitflächige Verwendung des Bildes, aber nicht alle erlauben die kommerzielle Nutzung oder Veränderung. Bei Creative Commons-Lizenzen muss der Urheber des Bildes erwähnt werden.

KI-generierte Bilder sind nicht urheberrechtlich geschützt, da sie nicht von einem Menschen erstellt werden. Daher befinden sich solche Bilder normalerweise in der Public Domain.

Das Problem besteht jedoch im Trainingsdatensatz, auf den ein Modell zurückgreift. Es kann Bildmaterial mit unterschiedlichen Lizenzen enthalten, und unter Umständen auch geschütztes geistiges Eigentum. Erzeugt ein KI-Bildgenerator nun ein Bild, das einem bereits vorhandenen Bild eines menschlichen Urhebers oder einer Marke eines anderen Unternehmens sehr ähnlich ist, könnten diese Parteien gegen die Verwendung des Bildes klagen. (Zum Beispiel kann ein KI-generiertes Bild von Superman immer noch durch dieselben rechtlichen Schutzmaßnahmen abgedeckt sein, die auch für offizielle Bilder der Figur gelten.)

Was erschwerend hinzukommt: Die Datensätze einiger KI-Modelle zur Bilderzeugung werden von KI-Scraper-Bots erstellt, die ohne Erlaubnis Text und Bilder auf Websites crawlen. Tatsächlich wird dies zu einem immer größeren Problem für Unternehmen, die nicht verhindern können, dass diese KI-Scraper-Bots ihre Daten abgreifen. Aus diesem Grund hat Cloudflare das Tool zur KI-Überwachung entwickelt. Es gibt Unternehmen Kontrolle über KI-Scraper-Bots, die ihre Medien und Websites durchsuchen.

Können KI-generierte Bilder kommerziell verwendet werden?

Bei KI-generierten Bildern hängt dies von der Lizenz und dem verwendeten Bildgenerierungsdienst ab. Einige Dienste zur KI-Generierung haben ihre Modelle auf einer kuratierten Sammlung von Bildern trainiert, für die sie die Rechte haben. Solche Dienste erlauben möglicherweise die kommerzielle Nutzung der von ihren Diensten generierten Bilder unter einer Creative-Commons-Lizenz; was bedeutet, dass auch andere die Bilder verwenden können. Diese Tatsache erschwert die kommerzielle Nutzung, da die Bilder nicht wie Originalbilder, Marken oder Warenzeichen vor der Nutzung durch Wettbewerber geschützt werden können.

Wie hilft Cloudflare Entwicklern beim Aufbau ihrer eigenen KI-Bildgeneratoren?

Cloudflare Workers AI bietet Full Stack-KI-Bausteine, mit denen Entwickler eine Vielzahl beliebter Modelle generativer KI, einschließlich Bildgeneratoren, in ihre Anwendungen integrieren und sie auf einem globalen Netzwerk von GPUs ausführen können. In diesem Tutorial zeigen wir Ihnen, wo Sie mit dem Erstellen von KI-Bildgeneratoren anfangen können.