Wachsende Produktivität: Auf die KI allein kommt es nicht an

Die Leistungsfähigkeit generativer Künstlicher Intelligenz wächst in einem Tempo, das selbst für das digitale Zeitalter außergewöhnlich ist. Sprachmodelle, denen man gerade noch mit gefühlter Überlegenheit beim Scheitern an den einfachsten Aufgaben zusehen konnte, strukturieren inzwischen komplexe Argumente, fassen anspruchsvolle Texte zusammen und schreiben als agentische KI sogar eigenständig Computerprogramme. Mit sich häufenden Berichten über die Substitution menschlicher Arbeitskraft durch KI wächst auch die Sorge über die Sicherheit des eigenen Jobs. Die tatsächliche Verbreitung und Nutzung von KI-Systemen hält mit ihren stetig wachsenden technischen Möglichkeiten indes keineswegs überall Schritt. Und das, obwohl sich die wöchentlichen Nutzerzahlen des meistgenutzten Sprachmodells ChatGPT allein innerhalb des letzten Jahres fast verdoppelt haben. Werkzeuge wie ChatGPT, Claude oder Gemini sind in manchen Bereichen längst fester Bestandteil des Arbeitsalltags. In anderen spielen sie bislang jedoch noch immer nur eine Nebenrolle. So deutet etwa eine Auswertung von Nutzerdaten durch das KI-Unternehmen Anthropic aus der jüngeren Vergangenheit darauf hin, dass selbst in Aufgabenfeldern, in denen sich KI-gestützte Automatisierung besonders anbietet, etwa in der Programmierung, bislang weniger als 40 Prozent des technischen Potentials ausgeschöpft werden. Die öffentliche Debatte fokussiert sich oft auf die technologischen Möglichkeiten von KI In der öffentlichen Debatte geht es oft darum, was technisch schon möglich scheint – und nicht, was gesellschaftlich, organisatorisch und institutionell erst noch entstehen muss. Das Potential neuer Technologien wird dabei auf kurze Sicht schnell überschätzt, die noch notwendigen Schritte zu ihrer tatsächlichen Verbreitung dagegen unterschätzt. Beispielsweise zeigt die Forschung der Ökonomen Daron Acemoglu oder Erik Brynjolfsson, dass technologischer Fortschritt vom Buchdruck bis zum Internet nicht von selbst Wohlstand schafft. Seit Jahrzehnten wird in der Wirtschaftswissenschaft immer wieder das sogenannte Produktivitätsparadoxon diskutiert. Zur Erinnerung: Süffisant hatte der Nobelpreisträger Robert Solow einmal formuliert, dass man das Computerzeitalter überall sehen könne, außer in den Produktivitätsstatistiken. Entscheidend ist also nicht immer die Technologie im abstrakten Sinn, sondern die Art und Weise, in der sie sich in bestehende Prozesse und Institutionen integrieren lässt. Das Muster ist vertraut: Schon lange bevor wir über KI diskutiert haben, war es möglich, zahlreiche Alltags- und Arbeitsprozesse zu digitalisieren. Doch zwischen Möglichkeit und Wirklichkeit lag schon damals ein weiter Weg – der vielerorts bis heute nur teilweise zurückgelegt worden ist. Ein in der aktuellen Debatte um die Auswirkungen von KI-Sprachmodellen unterschätzter Faktor ist der Nutzer selbst. Die Produktivitätsgewinne der KI sind nicht einfach ein Produkt ihrer technologischen Möglichkeiten. Sie hängen wesentlich davon ab, wer sich die neuesten Modelle aneignet und wie diese dann genutzt werden. An diesem Punkt setzt eine aktuelle experimentelle Studie an, die wir mit Mark Praet vom Fraunhofer-Institut für Angewandte Informationstechnik durchgeführt haben. Wir wollten nicht nur wissen, ob der Zugang zu einem großen Sprachmodell die Leistung von Studierenden verbessert. Uns interessierte vor allem, wie groß der Abstand zwischen Zugang und tatsächlicher Nutzung ist, wie stark dieser Abstand je nach Aufgabe variiert und was daraus für die Messung von KI-Produktivitätseffekten folgt. Wer nutzt KI – und wie? Für unsere Studie haben 210 Studierende Aufgaben aus drei Bereichen bearbeitet, die einem in fast jedem akademischen Berufsbild begegnen: kreative Problemlösung, Textverständnis und quantitatives Denken. Die Versuchsanordnung war dabei bewusst einfach. Eine Hälfte der Teilnehmenden hatte Zugriff auf ChatGPT, die andere nicht. Anders als in vielen bisherigen Onlinestudien war die Kontrollgruppe tatsächlich eine Kontrollgruppe. Wer in ihr saß, konnte während der Lösung der Aufgaben nicht nebenbei doch noch auf KI zurückgreifen. Zugleich konnten wir in der KI-Gruppe genau nachvollziehen, ob und auf welche Weise das bereitgestellte Werkzeug tatsächlich genutzt wurde. In einem zweiten Schritt wurden die anonymisierten Antworten dann von 1176 externen Personen bewertet, um festzustellen, wie gut die Aufgaben bearbeitet wurden. Unser erster Befund ist eindeutig und kaum überraschend: Zugang zu generativer KI verbessert im Durchschnitt die Qualität der Antworten. Wichtiger ist jedoch der zweite Befund: Diese Produktivitätseffekte verteilen sich keineswegs gleichmäßig. Die deutlichsten Zugewinne zeigen sich im Bereich der sprachintensiven Aufgaben – also überall dort, wo Informationen verdichtet, geordnet und in eine klare Form gebracht werden müssen. Auch bei quantitativen Fallstudien, bei denen Annahmen getroffen, Größenordnungen plausibel abgeschätzt und Gedankengänge neu strukturiert werden müssen, wirkt sich der Einsatz positiv aus. Merklich geringer fallen die Effekte dagegen bei einer Aufgabe aus, mit der wir die Kreativität der Teilnehmenden messen wollten. Hier musste eine möglichst neuartige und nützliche Erfindung erdacht werden. Nahezu ganz verschwinden sie dort, wo visuelle Informationen aus einem Diagramm in einen kurzen Text übersetzt werden sollten. Schon das relativiert die Vorstellung eines einheitlichen Produktivitätsschubs durch KI. Große Unterschiede in der Techniknutzung Noch aufschlussreicher sind deshalb unsere Daten zur tatsächlichen Nutzung. Selbst unter Bedingungen, die den Einsatz von KI eher begünstigen dürften, also bei einem direkten Zugang und sogar ausdrücklicher Aufforderung zur Nutzung, griffen längst nicht alle Teilnehmenden tatsächlich auf das angebotene Werkzeug zurück. Nur 29 Prozent setzten die KI in allen vier Aufgaben ein, 16 Prozent nutzten sie dagegen kein einziges Mal. Auch zwischen den Aufgabentypen zeigten sich deutliche Unterschiede. Beim Textverständnis griffen fast drei Viertel der Teilnehmenden auf KI zurück, in den Diagrammaufgaben dagegen nicht einmal die Hälfte. Hinzu kommen verschiedene Selektionsmechanismen. In unserem Experiment griffen vor allem jene häufiger zur KI-Unterstützung, die schon Vorerfahrung mit solchen Werkzeugen hatten. Auch individuelle Fähigkeitsprofile spielten eine Rolle. Damit wird deutlich, dass die wirtschaftliche Wirkung generativer KI nicht allein von den Fähigkeiten des Modells abhängt, sondern – wenig erstaunlich – natürlich auch von den Fähigkeiten der Nutzer. KI ist kein Werkzeug, das man nur bereitstellen muss. Ihr Nutzen hängt von komplementären Kompetenzen ab. Diese Kompetenzen zu entwickeln, wird zunehmend auch Aufgabe universitärer Hochschullehre. Im Rahmen des von der Stiftung Innovation in der Hochschullehre geförderten Projektes LAICA (Lüneburg AI Campus) werden wir uns in den kommenden Jahren gemeinsam mit Kolleginnen und Kollegen der Frage widmen, wie solche Kompetenzen in unterschiedlichen Studiengängen systematisch aufgebaut werden können. Die großen Umwälzungen am Arbeitsmarkt stehen noch aus Unsere Ergebnisse rücken eine klassische Einsicht der Ökonomik wieder ins Zentrum: Technologien entfalten ihren Ertrag nicht im luftleeren Raum. Sie brauchen Organisation, anpassungsfähige Institutionen und Zeit. Das galt für frühere Automatisierungswellen, und es gilt auch heute. Die Vorstellung, das bloße Vorhandensein einer Technologie werde automatisch breite Produktivitätsschübe erzeugen und Massenentlassungen nach sich ziehen, war schon in früheren Innovationsphasen oft zu kurz gegriffen. Im Falle der generativen KI dürfte dies auch gelten. Was folgt daraus? Wer verstehen will, wie KI Produktivität und Beschäftigung verändert, sollte nicht nur auf das schauen, was die neuesten Modelle theoretisch leisten können. Entscheidend ist auch, wer diese Werkzeuge tatsächlich nutzt und wofür. Genau hier deutet unsere Studie schon auf erhebliche Unterschiede hin, sowohl zwischen verschiedenen Nutzergruppen als auch zwischen unterschiedlichen Aufgabentypen. Auch andere Untersuchungen kommen zu ähnlichen Ergebnissen und zeigen deutliche Ungleichheiten, etwa zwischen Frauen und Männern. In einer Metastudie der Harvard Business School lag die durchschnittliche Wahrscheinlichkeit, dass Frauen KI im Beruf nutzen, um 22 Prozent unter der von Männern. Wenn also KI, wie in unserer Studie, auf individueller Ebene zu Produktivitätssteigerungen führt, dann kann ungleiche Nutzung bestehende Ungleichheiten verstärken oder aber auch nivellieren, wenn sie insbesondere von denjenigen eingesetzt wird, die ansonsten eine Aufgabe eher schlecht erfüllen würden. Erste Befunde, die sich auch in unserer Studie bestätigen, deuten darauf hin, dass KI häufiger dort hilft, wo Fähigkeiten schwächer sind, und eben nicht den Abstand der ohnehin Starken immer weiter erhöht. Neben der bei vielen Menschen ausgeprägten Neugierde beim Ausprobieren der neuesten Sprachmodelle schwankt die öffentliche Wahrnehmung zunehmend zwischen Faszination und Ermüdung. Aus FOMO, also „The Fear of Missing Out“, ist für viele Angestellte längst FOBO geworden, also „The Fear of Becoming Obsolete“, die Angst überflüssig zu werden. Mit Blick auf diese Sorgen dürften die beschriebenen Erkenntnisse relativierend wirken. Denn am Ende hat man es zumindest teilweise selbst in der Hand, KI produktiv im eigenen Job einzusetzen. Lehrreich ist zudem eine lange bestehende Einsicht, welche ihren Ursprung schon in der Zeit der industriellen Revolution hat. Würden Dampfmaschinen einmal alle menschliche Arbeit ersetzen, weil sie stärker und schneller als Muskelkraft sind? Das sogenannte Jevons-Paradox besagt, dass Beschäftigung nicht unbedingt immer dort zurückgehen muss, wo eine bessere Technologie eingeführt wird. Senkt diese Technologie nämlich Kosten, wie etwa KI aktuell in der Softwareentwicklung, kann die dadurch ausgelöste zusätzliche Nachfrage am Ende auch zu mehr Beschäftigung führen. Prof. Dr. Johannes Lohse ist Juniorprofessor für Law & Economics an der Leuphana Universität Lüneburg. Prof. Dr. Mario Mechtel ist Professor für Empirische Mikroökonomik an der Leuphana Universität Lüneburg und leitet den Wissenschaftsraum „Verhaltensökonomik und gesellschaftliche Transformation“, ein Forschungscluster von sieben niedersächsischen Universitäten und dem Fraunhofer FIT.

Wachsende Produktivität: Auf die KI allein kommt es nicht an

Viel zu oft geht es nur um die technologischen Aspekte der Künstlichen Intelligenz. Ein Experiment zeigt, wovon ihr Erfolg tatsächlich abhängt.