Mensch betrachtet futuristische Grabsteine mit Gehirn-Symbolen in einer digitalen Ruinenlandschaft bei Sonnenuntergang.

Der Pilot-Friedhof: Warum so viele KI-Piloten im Mittelstand nie in den Regelbetrieb kommen

Es gibt eine Statistik, die in Vorstandspräsentationen gerne zitiert wird und deren Herkunft niemand mehr genau kennt: Die Mehrheit aller KI-Pilotprojekte schafft es nicht in den Regelbetrieb. Die genauen Zahlen schwanken zwischen 70% und 90%, je nach Studie, Branche und Definition. Aber die Richtung ist eindeutig — und sie ist in keinem Vergleichszeitraum besser geworden.

Das erstaunliche daran: Die Verantwortlichen in den meisten Unternehmen wissen das. Sie haben es selbst erlebt. Sie haben einen Piloten gestartet, der funktionierte. Sie haben Ergebnisse präsentiert, die beeindruckten. Und dann ist das Projekt im Sand verlaufen — ohne klaren Beschluss zur Einstellung, ohne klaren Beschluss zur Skalierung. Es ist einfach nicht mehr passiert.

Diese Erfahrung ist so verbreitet, dass sie inzwischen als Normalzustand gilt. Das ist das eigentliche Problem. Nicht, dass KI-Piloten scheitern — sondern dass ihr Scheitern als unvermeidbarer Kollateralschaden des Innovationsprozesses akzeptiert wird. In Wirklichkeit folgt der Pilot-Friedhof einem Muster. Und wer das Muster erkennt, kann ihm entkommen.

Der Trugschluss des erfolgreichen Pilots

Die Ausgangssituation ist fast immer dieselbe. Ein Team identifiziert einen Anwendungsfall — Rechnungsprüfung, Kundenservice, Angebotserstellung, Wissensmanagement. Ein Tool wird ausgewählt, eine kleine Gruppe von Mitarbeitenden eingebunden, ein Testzeitraum definiert. Nach zwei oder drei Monaten liegen Ergebnisse vor: Zeitersparnis von X Prozent, Qualitätssteigerung in Y Dimensionen, Akzeptanz bei den Nutzern positiv. Der Pilot gilt als erfolgreich.

Genau hier beginnt das Problem. Ein erfolgreicher Pilot ist nicht der Beweis dafür, dass eine Anwendung skalierbar ist. Er ist der Beweis dafür, dass sie unter Pilotbedingungen funktioniert hat. Diese beiden Aussagen klingen ähnlich, unterscheiden sich aber fundamental.

Unter Pilotbedingungen arbeiten motivierte Mitarbeitende. Die Aufmerksamkeit der Führung ist hoch. Probleme werden schnell adressiert, weil das Projekt sichtbar ist. Die Nutzergruppe ist klein genug, dass jeder Ausfall persönlich gelöst werden kann. Die Dokumentation ist oft fragmentarisch, weil das Team sich selbst hilft. Und die Schnittstellen zu bestehenden Prozessen sind noch nicht wirklich gebaut — der Pilot läuft parallel, nicht integriert.

All diese Bedingungen existieren im Regelbetrieb nicht mehr. Dort arbeiten auch weniger motivierte Mitarbeitende mit dem Tool. Die Führung ist längst mit dem nächsten Thema beschäftigt. Probleme müssen über Support-Strukturen gelöst werden, die es im Pilot noch nicht gab. Die Nutzergruppe ist größer, heterogener, unberechenbarer. Und die Integration in bestehende Prozesse ist keine technische Fleißaufgabe, sondern ein organisationales Großprojekt.

Wer vom Piloten in den Regelbetrieb will, überführt nicht ein funktionierendes System in eine größere Umgebung. Er baut ein anderes System — und dieser Unterschied wird fast nie explizit gemacht.

Die drei Gräber des Pilot-Friedhofs

In der Praxis zeigen sich drei wiederkehrende Muster, unter denen KI-Piloten sterben. Keines davon hat mit der KI selbst zu tun.

Erstens: Die Ownership-Lücke nach dem Pilot. Während des Piloten ist klar, wer verantwortlich ist: das Projektteam, meist mit einer sichtbaren Leitung und klarer Unterstützung durch die Geschäftsführung. Sobald der Pilot endet, wird diese Klarheit diffus. Wem gehört das Tool jetzt? Der IT, die es betreibt? Der Fachabteilung, die es nutzt? Einer neuen Rolle, die niemand geschaffen hat? In vielen Unternehmen fällt das Tool in eine Verantwortungslücke, in der niemand aktiv dafür zuständig ist, es weiterzuentwickeln, Probleme zu adressieren oder die Nutzung zu fördern. Es funktioniert noch eine Weile, bis es nicht mehr funktioniert — und dann gibt es niemanden, der sich kümmert.

Zweitens: Die fehlende Integration in Prozesse. Piloten laufen meist neben bestehenden Prozessen her. Die KI schlägt eine Klassifikation vor, aber die eigentliche Klassifikation erfolgt weiter im alten System. Die KI erzeugt einen Textentwurf, aber die eigentliche Kundenkommunikation läuft weiter wie gewohnt. Diese Parallelität ist im Pilot sinnvoll — sie reduziert Risiko und ermöglicht Vergleich. Im Regelbetrieb wird sie zum Killer. Denn wenn beide Systeme parallel laufen, entsteht doppelte Arbeit statt Zeitersparnis. Mitarbeitende fallen zurück in das alte, vertraute System. Die KI wird zur optionalen Zusatzfunktion, die irgendwann nicht mehr genutzt wird. Skalierung bedeutet nicht, mehr Nutzer auf das Tool zu setzen. Es bedeutet, den Prozess so umzubauen, dass er ohne die KI nicht mehr effizient wäre.

Drittens: Die Lernarchitektur, die nie gebaut wurde. Ein Pilot endet mit einem Ergebnis — meist einer Präsentation, oft einer Empfehlung, manchmal einer Rollout-Entscheidung. Was er selten produziert, ist eine Infrastruktur, in der das Lernen über die KI fortgesetzt werden kann. Wie werden Fehler erkannt und korrigiert? Wer bewertet neue Anwendungsfälle? Wie wird entschieden, wann das Modell aktualisiert werden muss? Wer dokumentiert Erfahrungen, damit neue Mitarbeitende nicht bei Null anfangen? Ohne diese Strukturen wird der Pilot zur Momentaufnahme. Er hat einmal gezeigt, dass es funktionieren kann — und dann friert die Organisation auf diesem Stand ein, bis der Stand nicht mehr trägt.

Warum ambitionierte Programme das Problem verschärfen

Eine verbreitete Reaktion auf den Pilot-Friedhof ist, die Piloten größer zu machen. Mehr Ressourcen, mehr Beteiligte, klarere Governance, ambitioniertere Ziele. Die Logik dahinter: Wenn viele kleine Piloten scheitern, dann müssen wir weniger, aber größere Piloten machen.

Diese Logik führt in eine andere Falle. Große Piloten bündeln Aufmerksamkeit, aber sie versprechen auch mehr — und werden damit politisch belasteter. Je sichtbarer ein Pilot ist, desto weniger Raum gibt es für das unangenehme Eingeständnis, dass er vielleicht doch nicht skaliert. Misserfolge werden kaschiert, nicht analysiert. Teilerfolge werden als Erfolge verkauft. Und wenn am Ende doch nichts im Regelbetrieb ankommt, wird das Projekt stillschweigend beerdigt, damit niemand sein Gesicht verliert.

Der Weg aus dem Pilot-Friedhof führt nicht über größere Piloten. Er führt über ein anderes Verständnis davon, was ein Pilot eigentlich leisten soll.

Was ein Pilot wirklich klären muss

Die meisten Piloten werden mit der impliziten Frage gestartet: „Funktioniert das Tool?“ Das ist die falsche Frage. Ob das Tool funktioniert, ist in der Regel bereits durch andere Anwender bewiesen. Die relevanten Fragen sind andere.

Ein Pilot sollte drei Dinge klären, bevor über Skalierung gesprochen wird.

Erstens: Unter welchen Bedingungen erzeugt das Tool in unserer Organisation Nutzen? Nicht in abstrakten Fällen, sondern in konkreten Situationen. Welche Nutzer profitieren am meisten? Welche Datenlage ist notwendig? Welche Prozessschritte müssen vorhanden sein? Diese Fragen sind spezifisch und oft unbequem — sie zeigen, dass nicht jede Abteilung gleich geeignet ist.

Zweitens: Welche organisationalen Strukturen müssen existieren, damit das Tool dauerhaft funktioniert? Wer betreut es? Wer entscheidet über Änderungen? Wie wird Qualität gemessen? Wie wird Feedback verarbeitet? Diese Strukturen sollten während des Piloten entstehen — nicht erst danach. Ein Pilot, der keine Betreuungsstruktur hervorbringt, hat einen wesentlichen Teil seines Zwecks verfehlt.

Drittens: Was bedeutet Skalierung konkret — und was kostet sie? Wie viele zusätzliche Nutzer, in welchen Abteilungen, mit welchem Schulungsaufwand, welcher Prozessanpassung, welcher Lizenzkostenstruktur? Diese Rechnung wird im Pilotstadium selten seriös gemacht, weil sie mühsam ist. Dabei ist sie der eigentliche Entscheidungsanker für den Schritt in den Regelbetrieb.

Ein Pilot, der diese drei Fragen beantwortet, braucht nicht groß zu sein. Er muss nur ehrlich sein. Und er muss mit dem Bewusstsein gestartet werden, dass die erfolgreiche Ausführung einer KI-Funktion nicht das Ziel ist, sondern die Voraussetzung. Das eigentliche Ziel ist das Lernen über die eigene Organisation.

Die unbequeme Wahrheit über Skalierung

Skalierung von KI-Anwendungen ist kein technisches Problem. Sie ist in den allermeisten Fällen ein organisationales. Die Technologie lässt sich ausrollen. Die Lizenzen lassen sich erweitern. Die Integrationen lassen sich bauen. Was sich nicht ausrollen lässt, ist die Aufmerksamkeit, die im Pilot vorhanden war. Der Problemlöse-Reflex des Projektteams. Die Bereitschaft der Geschäftsführung, sich persönlich einzumischen, wenn es hakt.

Diese Ressourcen sind knapp. Sie lassen sich nicht beliebig vermehren. Deshalb ist die entscheidende Frage beim Übergang vom Pilot zum Regelbetrieb nicht: Wie skalieren wir die Technologie? Sondern: Welche Strukturen müssen die Rolle übernehmen, die im Pilot das Projektteam gespielt hat?

Die Antwort ist selten glamourös. Sie besteht aus geklärten Verantwortlichkeiten, dokumentierten Prozessen, definierten Eskalationswegen und regelmäßigen Austauschformaten. Aus Governance, die klein genug ist, um nicht zu ersticken, und groß genug, um Richtung zu geben. Aus Ressourcen, die explizit zugewiesen sind — nicht implizit aus dem Alltagsgeschäft abgezwackt.

Wer diese Strukturen vor dem Rollout baut, skaliert. Wer sie erst im Rollout bauen will, landet auf dem Pilot-Friedhof.

Was jetzt ansteht

Die Mehrheit der Unternehmen, die gerade mit KI experimentieren, wird in den kommenden zwei bis drei Jahren ihre eigenen Pilot-Gräber anlegen. Das ist kein pessimistisches Szenario, sondern eine nüchterne Extrapolation der Vergangenheit. Die Frage ist nicht, ob es passiert — sondern wer die Lehren daraus zieht.

Für Unternehmen, die gerade Piloten starten oder planen, lohnt sich eine einfache Übung: Vor dem Start explizit aufschreiben, was eine erfolgreiche Skalierung drei Monate nach Pilotende konkret bedeuten würde. Welche Prozesse wären umgestellt? Welche Rollen gäbe es? Welche Budgets wären gebunden? Welche Lernschleifen würden laufen?

Wenn diese Beschreibung nicht formulierbar ist, ist der Pilot noch nicht startbereit. Nicht, weil die Technologie nicht funktioniert. Sondern weil die Organisation noch nicht weiß, was sie mit ihr anfangen will.

Pilotprojekte sind keine Machbarkeitsstudien. Sie sind Lerngelegenheiten. Und Lernen lässt sich nur vorbereiten, nicht verordnen.

Einordnung

Dieser Beitrag ist Teil unseres Themenfelds AI Readiness & organisationale Reife. Er greift die Beobachtung auf, dass die Hürde für den Erfolg von KI selten in der Technologie liegt — sondern in den Strukturen, Lernprozessen und Entscheidungsarchitekturen, die Organisationen um sie herum bauen oder nicht bauen. Vertiefende Beiträge behandeln die Rolle von Führung, Entscheidungslogik und Lernkultur im KI-Kontext.