Künstliche Intelligenz (KI) hat nicht nur im beruflichen, sondern bei einigen sogar in den persönlichen Alltag Einzug erhalten. Was man früher andere Menschen fragte, gab man die vergangenen Jahre in Google ein – inzwischen stehen diverse KIs uns Frage und Antwort. Und auch vor der Bildgenerierung macht die Technik nicht Halt: Mittlerweile ist das Internet voll von künstlich erzeugten Bildern. Dabei handelt es sich nicht nur um unrealistische oder surreale Darstellungen, wie etwa eisschleckende Einhörner auf Skateboards. Darunter befinden sich auch real wirkende Portraits von Menschen oder Landschaftsbilder.

Wie funktioniert KI-gestützte Bildgenerierung?
Dass es Bildgenerierung mit KI gibt, dürfte den meisten Menschen bekannt sein. Doch wie funktionieren Programme wie eigentlich? Ähnlich wie bei Chatbots, die Gespräche simulieren und Fragen beantworten können, erzeugt ein KI-Bildgenerator seine Ergebnisse aufgrund sogenannter Prompts. Je präziser diese Textbeschreibungen ausfallen, desto genauer wird das Ergebnis durch die KI. Zudem können sie bereits bestehende Bilder nach Wunsch bearbeiten. KI-Bildgeneratoren setzen beispielsweise auf Generative Adversarial Networks (GANs) oder neuronale Netzwerke. Der grobe Ablauf gestaltet sich folgendermassen:
Daten sammeln
Eine riesige Menge an Beispielfotos oder Bildern bildet die Grundlage für die KI, wie diverse Objekte, Formen, Farben und Muster aussehen.
Von Mustern lernen
Diese Datensammlung unterzieht die KI einer Analyse, um Muster, Strukturen und Zusammenhänge zu erkennen. So weiss die KI, wie zum Beispiel Autos aussehen, welche Farben in der Regel den Himmel zieren und wie sich die Struktur menschlicher Gesichter gestaltet.
Bilder generieren
Auf Basis des gelernten Bildaufbaus beginnt die KI mit der Erstellung neuer Bilder. Aus einer zufälligen Menge an Bilddaten, auch „Rauschen“ genannt, generiert die KI dann schrittweise ein neues Bild. Dabei nimmt sie Bezug auf die erlernten Muster.
Feinabstimmung
Häufig sind die erzeugten Bilder anfangs noch verpixelt oder unscharf. Mithilfe von Feedback-Mechanismen verfeinert die KI die Bilder Schritt für Schritt.
Iterativer Prozess
Die KI wiederholt diesen Prozess mehrfach und verbessert sich dabei, realitätsgetreue Bilder zu erschaffen, die den Beispielsdaten nahekommen.
Anwendungsbereiche der KI-Bildgenerierung
Einige Branchen setzen bereits auf KI bei der Bildgenerierung. Gründe dafür sind Vorteile wie Skalierbarkeit und Effizienz. Unternehmen können in kürzester Zeit automatisch mehr Bilder erstellen, was auch die Arbeitslast verringert. Die Zeit und Ressourcen, die sie dabei sparen, können sie in andere Bereiche investieren.
Kreative Gestaltung und Kunst
Künstler, Designer und Kreativschaffende setzen KI-Tools ein, um neue Ausdrucksformen zu entdecken, ihre Arbeitsprozesse zu optimieren und völlig neuartige Werke zu schaffen. Sie nutzen die Technologie dabei nicht als Ersatz für ihre Kreativität, sondern als Werkzeug ein, um neue Möglichkeiten zu entdecken und ihre Horizonte zu erweitern.
Marketing und Werbung
Von personalisierten Werbekampagnen bis hin zu effizienter Content-Produktion ermöglicht Bildgenerierung mit KI eine schnellere, kostengünstigere und kreativere Gestaltung von Marketingmaterialien. Traditionelle Fotoshootings oder manuelle Bildbearbeitung nehmen Zeit und Anspruch und verursachen weitere Kosten. Mit KI-Bildgeneratoren können Unternehmen innerhalb kürzester Zeit hochwertige Bilder erstellen – bei optimaler Anwendung.
Wissenschaft und Forschung
KI kommt zum Einsatz, um komplexe wissenschaftliche Konzepte zu visualisieren. Das macht etwa Molekularstrukturen, physikalische Prozesse oder astronomische Phänomene greifbarer. Ein anderes Beispiel findet sich in der Medizin: Die KI kann Röntgenbilder, MRTs oder CT-Scans analysieren und Muster oder Abnormalitäten erkennen, die dem menschlichen Auge verborgen bleiben.
Herausforderungen und Grenzen der Technologie
Die KI-Technik entwickelt sich rasant. Und auch wenn die Technologie in kürzester Zeit enorme Fortschritt erzielt hat und inzwischen einige KI-generierte Bilder kaum noch von realen Fotos zu unterscheiden sind, gibt es enorme Herausforderungen.
- Qualität: Nicht alle generierten Bilder entsprechen den tatsächlichen Vorstellungen und Vorgaben der Prompts. In manchen Fällen gibt Verzerrungen oder unrealistische Elemente. Vor allem bei menschlichen Händen und bei Schrift hat die KI häufig noch Probleme. Die Qualität der KI-generierten Bilder ist stark abhängig von Umfang und Qualität der Beispiel-Daten, der Modell-Architektur sowie der Trainingsparameter.
- Ethik: Bei KI-Bildern stellt sich die Frage nach dem Copyright. Sind die Ersteller der Prompts die Urheber? So einfach ist es nicht, denn die Beispiel-Daten basieren auf den Erzeugnissen anderer. KI-Bildgeneratoren sind in der Lage Bilder zu generieren, die urheberrechtlich geschützte Inhalte abbilden. Ausserdem ist Kreativität ein Thema: Ist es moralisch vertretbar, Künstler durch Rechenleistung zu ersetzen? KI-Bildgeneratoren sind nicht „kreativ“ im eigentlichen Sinne, denn sie ahmen Mustern und Strukturen nach.
- Rechenleistung: Um hochwertige Ergebnisse zu erzielen, braucht es eine enorme Rechenleistung. Und das führt zu höheren Kosten.