Wie jedes Jahr strömt auch dieses Frühjahr wieder Digital-Deutschland nach Hamburg zur OMR. Wahrscheinlich gibt es kaum ein Thema, das so heiß ist wie die vielen neuen Applikationen im Bereich Künstlicher Intelligenz. ChatGPT, Midjourney & Co. begeistern uns. Und sie stellen uns auch Fragen, die wir beantworten müssen. Als Menschen, als Institutionen und als Gesellschaft. „Ab hier übernimmt die AI“: Das gilt sicher zukünftig für viele Bereiche. Für wie viele? Das liegt an uns. Versuch einer Bestandsaufnahme.
Was ist generative AI?
Generative AI basiert im Kern auf Machine-Learning Modellen, in denen Sprachmodelle große Mengen an Daten lernen. Das können Texte, Designs, Code oder andere Medien sein. Das Ziel ist, einem Sprachmodell möglichst viele Datenabfolgen beizubringen, um daraus Prognosen für vergleichbare Anfragen zu ermöglichen. Zwar sind Sprachmodelle, die dazu in der Lage sind, schon seit 2015 in der Entwicklung. Aber es war das GPT-3 Sprachmodell des Unternehmens OpenAI, das den „iPhone Moment“ für generative AI bewirkte. Damit war es möglich, eben auch Bildgeneratoren, Chatbots und viele völlig andere Anwendungen zu schaffen, die uns das Leben leichter machen sollten. Eine neue Software-Kategorie war geboren.
Tatsächlich sind die Ergebnisse verblüffend. Tools wie ChatGPT, Midjourney, Dall-E, Stable Diffusion und viele andere beweisen, dass generative AI massenmarkttauglich ist und dabei absolut atemberaubende Ergebnisse schafft. Wenn ein Nutzer beispielsweise einem Text-Bild-Generator, wie Midjourney, mitteilt, dass er ein Bild von streitenden Enten in bayerischen Lederhosen im Mangastil generiert bekommen möchte, wird dieser ein entsprechendes Bild generieren. Wenn User:innen einen Chatbot, wie ChatGPT, darum bitten, dass sie einen SEO-optimierten Aufsatz über Alpha Centauri, geschrieben im Stile Johann Wolfgang von Goethes, erwarten, werden sie einen entsprechenden Text generiert bekommen. Eine neue Software-Kategorie explodiert förmlich und jeden Tag entstehen neue Anwendungen auf Basis generativer AI. Und wir stehen erst ganz am Anfang.
Riesen Chance oder Kontrollverlust?
Generative AI verblüfft. Noch sind Tools, wie Midjourney, nicht mal mit einem eigenen User-Interface ausgestattet, und dennoch revolutionieren sie bereits Branchen und Produktionsabläufe. Der Grund ist simpel: Generative AI schafft in kürzester Zeit Ergebnisse in einer Qualität, für die Designer:innen, Autor:innen, Entwickler:innen und diverse andere Berufe sehr viel Zeit hätten aufwenden müssen. Zugegeben: Die kreativen Ergebnisse generativer AI sind in Content-Produktionsabläufe anders einzubinden als klassische Kreativarbeit. Ergebnisse sind weniger vorhersehbar und damit noch nicht komplett mit menschlicher Arbeit vergleichbar. Aber das ändert sich. Jeden Tag überzeugen Generative AI Tools ehr und damit stellen sich unweigerlich viele Fragen für die Kreativwirtschaft:
- Ist menschliche Arbeitsleistung die Ergebnisse Generativer AI überhaupt vergleichbar
- Wo ist Generative AI stark und wo nicht? Wo entwickeln sich gerade neue Fähigkeiten?
- Was kann AI, was Menschen nicht können?
- Ersetzt Künstliche Intelligenz ganze Berufsbilder und wenn ja, welche?
- Wie wird es uns verändern, wenn wir bestimmte Arbeiten nicht mehr selbst erledigen sondern an AI auslagern?
- Wie verhält sich künftig der Wert menschlicher Arbeit zu den Ergebnissen Künstlicher Intelligenz? Sind „wir“ dann überhaupt noch wettbewerbsfähig?
- Wem gehören die Ergebnisse künstlicher Intelligenz, wenn ihre Sprachmodelle mit menschlichen Medien trainiert wurden? Wie kodifizieren wir das rechtlich?
- Ist eine wahrlich Künstliche Intelligenz zukünftig überhaupt kontrollierbar? Oder richtet sie sich auch gegen ihre Schöpfer:innen?
Selbst diese Liste kann nur einen ersten Eindruck von den vielfältigen Fragen rund um den Einsatz Generativer AI und den möglichen Folgen für uns abdecken. Wir befinden uns in extrem spannenden Zeiten mit großen Chancen und durchaus auch einigen Risiken.
Positiv denken: Was generative AI kann
Generative AI ist ein Feld in Entwicklung. Jeden Tag entstehen irgendwo auf der Welt Startups und Forschungseinheiten, die einen bestimmten Aspekt Generativer AI weiterentwickeln. Das Thema ist mittlerweile die wesentliche Frage in der Zukunftsausrichtung der großen Digital-Plattformen geworden. Microsoft und Google liefern sich ein Rennen um die Marktmacht im künftigen Searchmarkt, bei dem Microsoft durch seine Allianz mit OpenAI vorne liegt. Und auch Meta, Amazon, Adobe und viele andere bringen Funktionalitäten auf den Markt, die digitale Anwendungen durch Künstliche Intelligenz nachhaltig verändern und verbessern sollen. Besonders sichtbar sind AI Anwendungen aktuell in den Kategorien:
Grafik, 3D und Bildbearbeitung
Midjourney, Dall-E2, Stable Diffusion und viele andere revolutionieren die Kreativbranche. Mit Eingabe von Textbefehlen (Prompts) lassen sich in Windeseile Visualisierungen, Bildkonzepte und Fantasiewelten erschaffen. Während manche Tools dabei komplett auf neugenierte Inhalte setzen, bietet beispielsweise die beliebte Social Media Software Canva AI-generierte Bildüberarbeitung an. Andere Tools fokussieren sich auch bisher arbeitsintensive Felder wie 3D, Bildcolorierung (was uns durchaus ein anderes Bild der Vergangenheit vermitteln wird) oder User Experience Design. Hier forschen Entwickler:innen daran, wie man ganze Websites nur durch Prompts oder einfache Zeichnungen zum Leben erwecken kann. Viele andere Innovationen sind auf dem Weg.
Informationsverarbeitung und Search
Mit dem mächtigen GPT-4 Sprachmodell hat das bis vor zwei Jahren der breiten Öffentlichkeit weithin unbekannte Unternehmen OpenAI seinen Weg an die Weltspitze beschleunigt. GPT-4 kann sehr große Mengen an Daten verarbeiten und interpretieren. Mit dem Chatbot ChatGPT findet dieses Wissen seinen praktischen Ausdruck: ChatGPT kann Texte verfassen, andere Texte zusammenfassen, Kurzanalysen fahren, SEO-Texte optimieren und Prompts für Midjourney verfassen. Microsoft setzt das Tool zusätzlich in seiner Suchmaschine Bing ein. Google setzt mit Bard ein System dagegen, dessen Leistungsfähigkeit wir in den nächsten Wochen und Monaten noch testen werden. Viele andere Chatbots sind aktuell in der Entwicklung oder bereits für Spezialthemen wie Werbetexte, Übersetzungen oder SEO-Optimierung im Einsatz.
Video und Sprachsynthese
Vom Promovideo bis zur Mitarbeiter:innenschulung: Anbieter wie Pictory, Synthesia und viele andere generieren Videos aus Basis von Texten. Soll eine Sprecherin in Deutsch, Französisch und Englisch das Produkt erklären? Kein Problem. AI Videogeneratoren schaffen Bewegtbildwelten für viele Anwendungszwecke – und täglich kommen neue dazu. Aber auch im Bereich Sprachsynthese – also der Generierung von Stimmen und Text-to-Speech-Voiceovers – bewegt sich einiges: Google und Microsoft stricken ebenso an eigenen Lösungen wie es viele andere Anbieter tun. AI-Anwendungen in den Bereichen Video und Sprachsynthese helfen Unternehmen vor allem dabei, Content relativ kostengünstig zu produzieren und skalierbar zu machen.
Viele weitere Anwendungsfelder: Schon der Versuch, einen Überblick über die Vielzahl möglicher Anwendungsfelder generativer AI zu schaffen, ist eine Herausforderung. Denn faktisch wird Künstliche Intelligenz in fast jedem Bereich Folgen haben mit Anwendungen und Business Lösungen, die bestehende Prozesse beschleunigen wollen. Gleich, ob mit Low-/No-Code Anwendungen, die Entwickler:innen-Handwerk Amateuren zugänglich machen bis hin zu Tabellenkalkulationen, SEO, Gaming und Finanz-Apps: AI ist in allem drin.
Übernimmt ab jetzt die AI?
In einer gewissen Hinsicht übernimmt AI tatsächlich. Mit der technischen Revolution großer Sprachmodelle und der Ankündigung von OpenAI, seine API zur App-Entwicklung zu öffnen, ist der Siegeszug Generativer AI sicher. Jetzt, in diesem Moment, entstehen tausende neue Applikationen, die die Kraft generativer AI nutzbar machen. Vieles wird für uns damit einfacher. Und auch kleine Unternehmen haben die Chance, neue Nischen und Möglichkeiten mit generativer AI zu nutzen. So sind beispielsweise Erklärvideos für die Produkte von Startups künftig ebenso günstig mehrsprachig produzierbar wie es die Zusammenfassung von Goethes Faust ist.
Aber genau hier beginnt auch die Herausforderung für uns als Gesellschaft: Jede disruptive Technologie bringt ihre eigenen Herausforderungen mit. Wo neue Produktvitätsnischen entstehen, verlieren andere Menschen möglicherweise ihren Job. Wo Menschen ChatGPT nutzen, um sich einen Text auf Englisch kürzen zu lassen, fragen sich Eltern und Lehrer:innen wer künftig die Hausaufgaben macht. Und dass sich die neuen Möglichkeiten in Sachen Bildbearbeitung und Deepfake-Videos auch perfekt zur politischen Stimmungsmache und zur Desinformation einsetzen lassen, wurde auch schon bewiesen. Das sind aber nur die vordergründigen Herausforderungen. Sorge macht vielen Fachleuten auch, dass wir uns künftig zu sehr auf eine AI verlassen, die selbst nur existierende Daten repliziert, diese aber nicht kognitiv einordnen kann. "Die Gefahr der generativen KI besteht darin, dass sie nicht in der Lage ist, Fehlinformationen zu verstehen, was dazu führt, dass Korrelationen fälschlicherweise mit Kausalzusammenhängen gleichgesetzt werden“, sagt der HP Chef-Technologe Tom Golway. „Die unbeabsichtigte Folge ist, dass die Technologie die gesellschaftlichen Ansichten über Politik, Kultur und Wissenschaft prägt." Und einer der Vordenker neuronaler Netze, Geoffrey Hinton, hat gerade aus Sorge einen Job bei Google gekündigt: „Diese Dinger sind völlig anders als wir. Manchmal denke ich, es ist, als wären Außerirdische gelandet und die Menschen hätten es nicht bemerkt, weil sie sehr gut Englisch sprechen."
Unsere Gesellschaft muss sich viele neue Fragen stellen. Wie in jeder umfassenden Innovationsphase sollten wir optimistisch mit den vielen Chancen umgehen, die gerade sichtbar werden. Aber die AI-Revolution ist eben auch zu umfassend, dass wir die Risiken ignorieren können. Der Einsatz von Künstlicher Intelligenz ist viel zu mächtig um nur als neuer Typ Anwendung durchzugehen. AI hat das Potenzial, Gesellschaften nachhaltig zu verändern. Als Gesellschaft sollten wir Innovation begrüßen, aber auch steuern, was aus großen, neuen Entwicklungen resultiert.
Ethische AI als Lösung?
Künstliche Intelligenz kann nicht ethisch oder unethisch handeln. Aber die Folgen ihres Einsatzes können sehr wohl ethische Folgen in unserer Gesellschaft haben. Ob „AI übernimmt“ liegt letztendlich an uns und inwiefern wir zu viel Kontrolle abgeben.
Um hier zu „guten Regeln“ zu kommen, haben verschiedene Institutionen Vorschläge gemacht, wie ein Ethik-Kodex in Zeiten der Künstlichen Intelligenz aussehen kann, der den Menschen in den Mittelpunkt stellt. 2022 publizierte die Europäische Union dazu „Die Ethik-Leitlinien für eine vertrauenswürdige KI“. Auch sehr lesenswert ist „Algo.rules“ der Bertelsmann Stiftung, der als Praxisleitfaden sehr konkrete Vorschlöge zur ethischen Nutzung künstlicher Intelligenz macht.
Gemein haben diese Guidelines, dass sie von AI-Systemen die Einhaltung bestimmter Regeln fordern. So muss das Konzept eines AI-Systems immer vom Menschen geplant, verstanden, verantwortet und transparent gemacht werden. Systeme müssen technisch robust gebaut sein und ihre Funktionen sollten fortwährend getestet werden. Nachvollziehbarkeit von AI Entscheidungen muss ebenso gewährleistet sein wie die Möglichkeit zu Systemeingriffen und der Wirkungsüberprüfung. Kurz: Der Mensch versucht in Kontrolle zu bleiben. Ab wann KI übernimmt, bestimmen wir. Aber selbst ohne Machtübernahme der Roboter müssen wir uns viele Fragen stellen.
Artikel teilen
Weitere Geschichten
Diese Ratgeber könnten Dich auch interessieren
Stefan ist seit 1994 als Online-Redakteur für unsere Webseite verantwortlich.
Hobbies: Bodybuilding, Reisen, Autos, Motorräder, Heavy Metal, American Football.