Blog | FELD M

KI ist nicht gleich KI: das AI Readiness Framework | FELD M

Geschrieben von Laura Winkelbauer | 2.6.2026

Laut dem britischen Medienunternehmen The Guardian haben aktuelle Studien ergeben, dass KI-Agenten in fast 700 untersuchten Anwendungsfällen betrügerisches Verhalten gezeigt haben. Über sechs Monate hat sich dieses Verhalten verfünffacht, und zwar nicht unter Laborbedingungen, sondern im digitalen Alltag.

In diesem Beitrag erläutert Laura Winkelbauer, Data Strategy Consultant bei FELD M, warum es ein Fehler ist, Künstliche Intelligenz als einheitliches Phänomen zu betrachten. Sie zeigt Ihnen, wie Sie in Ihrem Unternehmen KI mithilfe eines strategischen Frameworks erfolgreich operationalisieren können.

 

Warum viele Unternehmen bei der KI-Einführung scheitern

Viele Unternehmen, mit denen wir zusammenarbeiten, arbeiten immer noch die Folgen des Generative-AI-Hypes auf und versuchen, Bedarf, Anforderungen und Use-Cases mit der Betriebsrealität zu vereinen.

Auch wenn KI kein neues Thema war und viele Unternehmen KI-Systeme und Modelle unter anderen Namen wie ML-Modelle, Advanced Analytics oder Data Science bereits nutzten, rückte das Thema mit der Veröffentlichung von ChatGPT im Herbst 2022 ins Bewusstsein der Führungsetage.

Das Thema war bislang eher Data Engineers und Data Scientists vorbehalten. Auf einmal sprachen Vertreter aller Fachabteilungen über KI-Anwendungsfälle und das Potenzial der Künstlichen Intelligenz. Und damit verschob sich etwas: Plötzlich musste jedes Unternehmen „etwas mit KI machen".

 

Blinder Aktionismus statt einer strukturierten Herangehensweise

Dieser Handlungsdruck, etwas mit KI machen zu müssen, führte zu neuen Herausforderungen und in vielen Organisationen zeigte sich dabei ein altbekanntes und vorhersehbares Muster: Blinder Aktionismus statt einer strukturierten Herangehensweise.

In einigen Unternehmen kam der „Tone from the Top". Da hieß es, KI entlang der gesamten Wertschöpfungskette einzuführen und Best Practices auszurollen  – in der Annahme, Organisation und Daten seien bereit für Künstliche Intelligenz. Andere mobilisierten von unten: Mitarbeitende generierten Ideen in alle Richtungen und trieben einzelne Piloten oder Prototypen voran, ohne eine übergeordnete Zielsetzung.

Doch selten wurde neben den Chancen auch ein geregelter Umgang mit Risiken von Künstlicher Intelligenz thematisiert, und die Mitarbeitenden wurden mit unklaren und teilweise überzogenen Erwartungen allein gelassen.

Dies sorgte zum einen dafür, dass einige Mitarbeitende um ihre Jobsicherheit fürchteten, während andere aufgrund systemischer Unsicherheiten, mangelnder Datenqualität oder fehlender Zielsetzung scheiterten.

Allerdings bedeutet das nicht, dass Künstliche Intelligenz per se gescheitert ist. KI-Modelle und -Systeme haben sich unglaublich schnell verändert, schneller als die organisatorischen Rahmenbedingungen, und damit fehlte schlicht die Grundlage für einen erfolgreichen Betrieb.

Was jetzt zählt, ist ein gemeinsames Verständnis zu schaffen sowie Strukturen und Guidelines aufzubauen, damit Unternehmen strategisch statt reaktiv vorankommen.

 

Das FELD M Framework für KI-Einführung: Strategie vor Technologie

Um Unternehmen einen zielorientierten Weg zur KI-Adoption zu ermöglichen, haben wir das FELD M AI Strategy Framework entwickelt.

Bevor wir nun aber einsteigen, eine Anmerkung vorweg: Wir sind überzeugt, dass Künstliche Intelligenz die Unternehmensstrategie unterstützen muss und sich eng an den Zielen der Fachbereiche orientieren sollte. Eine eigenständige KI-Strategie wird voraussichtlich nicht funktionieren.

 

 

Aus diesem Grund bietet es sich an, einen detaillierteren Blick auf die Dimensionen zu werfen, die wir für den erfolgreichen Einsatz von Künstlicher Intelligenz als entscheidend ansehen:

 

 

1. Ziele und Anwendungsfälle

Fragen Sie sich zunächst: Was will unsere Organisation mit KI erreichen und wie kann KI Mehrwert schaffen? Schnell wird deutlich, dass es dafür mehreres braucht:

  • eine klare Vision für KI,

  • definierte Rahmenbedingungen für ihren Einsatz,

  • eine konsequente Ausrichtung an den Geschäftszielen,

  • und ein priorisiertes Use-Case-Portfolio, das Business Impact, Machbarkeit und strategischen Fit berücksichtigt.

Ohne diesen Bezug laufen Teams Gefahr, dem heiligen Gral hinterherzujagen.

 

2. Technische Infrastruktur

Ohne solides Fundament versanden gute Ideen sehr häufig in Präsentationen. Eine gute Infrastruktur ist die Voraussetzung für die erfolgreiche Operationalisierung von KI-Anwendungsfällen. Dazu zählen beispielsweise folgende Faktoren: eine tragfähige Plattformarchitektur, geeignete Tools, MLOps-Praktiken sowie die Fähigkeit, funktionierende Prototypen zuverlässig zu skalieren.

 

3. Daten

Auch für Künstliche Intelligenz gilt das gute alte „Garbage in, garbage out"-Prinzip, kurz GIGO. Eine funktionierende Data Governance, definierte Data Security Standards und eine gelebte Compliance sind Grundvoraussetzungen für den erfolgreichen Einsatz von KI-Modellen und Systemen und deren Skalierung.

Wichtig ist, dass insbesondere agentische KI erweiterte Anforderungen an bestehende Datenqualitätsmerkmale wie Aktualität, Verfügbarkeit und Zugriff stellt.

 

4. Methodik

 

Hier geht es darum, KI wirksam und konsequent umzusetzen. Das heißt konkret:

  • den richtigen KI-Ansatz für jeden Use Case auszuwählen,

  • Modellergebnisse in echte Geschäftsentscheidungen oder Aktionen zu übersetzen,

  • klar zu definieren, was Erfolg bedeutet,

  • die Modellperformance kontinuierlich zu überwachen

  • und sicherzustellen, dass KI durchgängig sicher und ethisch korrekt eingesetzt wird.

 

5. Organisation

Hier geht es um klare Rollen, Verantwortlichkeiten und Kompetenzen für den Betrieb und die Dokumentation von KI-Anwendungsfällen innerhalb des Unternehmens:

Wer ist wofür verantwortlich? Wie arbeiten Fachverantwortliche, Datenabteilungen und IT tatsächlich zusammen? Wie können externe Partner eingebunden werden, ohne die Steuerung aus der Hand zu geben?

 

6. Enablement

Können KI-Modelle und Systeme sicher und verantwortungsvoll von Mitarbeitenden entwickelt und genutzt werden? KI-Kompetenz ist wichtig und sieht für verschiedene Zielgruppen unterschiedlich aus. Diese Dimension umfasst auch das Governance-Framework: Regeln, Leitplanken und Durchsetzungsmechanismen sowie etwas, das schwerer einzuordnen, aber unverzichtbar ist: psychologische Sicherheit und eine echte Test-and-Learn-Kultur.

Die sechs beschriebenen Dimensionen begünstigen sich gegenseitig. Eine Vernachlässigung einer Dimension führt zur Schwächung aller. Sie können nicht isoliert voneinander wirken, wenn eine übergeordnete Vision oder Zielsetzung erreicht werden soll.

 

Der häufigste Fehler bei der KI-Einführung: KI ist nicht gleich KI

Wir haben oft beobachtet, wie Unternehmen immer wieder denselben Fehler machen: AI Readiness als eine einmalige Angelegenheit, einen One-size-fits-all-Ansatz zu betrachten, der pauschal über alle Fachbereiche entlang der Wertschöpfungskette implementiert werden kann und einfach funktioniert.

Der Grund, warum diese Betrachtung nicht erfolgreich ist, dass KI nicht gleich KI ist und vor allem KI nicht nur generative KI ist. Es gibt eine Vielzahl von KI-Anwendungsfällen, mit unterschiedlichen KI-Methoden, eigenen Herausforderungen und unterschiedlichen Anforderungen. Alle gleich zu behandeln wäre, als würden Sie denselben Ansatz für den Einkauf von Office-Software, den Bau einer Produktionsanlage und den Launch einer Marketingkampagne verwenden.

Um das zu veranschaulichen, haben wir vier grundlegend verschiedene KI-Anwendungen herausgegriffen – wir nennen sie „Beasts". An ihnen zeigen wir, wie die sechs Dimensionen unseres Frameworks jeweils zusammenspielen.

 

Die vier Typen von KI-Anwendungen (unsere „Beasts")

 

Beast 1: Produktivitätstools von der Stange (ChatGPT, Copilot, Grammarly AI)

Die Wertschöpfungskette umfasst die Schritte: 
Beschaffung → Steuerung → Einführung → Nutzung

Die Hürde hier ist Adoption und klare Richtlinien. Die Hälfte Ihrer Mitarbeitenden nutzt diese Tools bereits, die andere Hälfte wartet darauf, dass es erlaubt wird.

Die richtige Readiness-Frage: Dürfen und sollen unsere Mitarbeitenden diese Tools aktiv nutzen?

Framework-Schwerpunkt: Dimension 1 (klare Leitlinien) und Dimension 6 (Enablement, Governance, Kultur) sind hier entscheidend. Infrastruktur und Methodik spielen eine untergeordnete Rolle.

 

Beast 2: Vom Anbieter eingebettete KI (Salesforce Einstein, SAP Joule, ServiceNow AI)

Die Wertschöpfungskette umfasst die Schritte:

Bewerten → Beschaffen → Konfigurieren → Integrieren → Einführen

Die Komplexität liegt darin, die Tools mit Ihren Daten zu verbinden. Sie stehen vor zwei parallelen Hürden: technischen Integrationsherausforderungen und Lücken in der organisatorischen Bereitschaft zur Adoption. Das macht die Umsetzung deutlich schwieriger, als der Vendor-Pitch vermuten lässt.

Die richtige Readiness-Frage: Können wir das tatsächlich anbinden und nutzen?

Framework-Schwerpunkt: Dimensionen 2 (Infrastruktur), 3 (Daten) und 5 (Organisation) werden hier kritisch. Sie müssen klären, ob Ihre Datenlandschaft und Ihre Teamstrukturen überhaupt bereit sind, bevor Enablement relevant wird.

 

Beast 3:  Individuelle LLM-Anwendungen

(RAG chatbots, Dokumentenanalyse, semantische Suchen)

Die Wertschöpfungskette umfasst die Schritte: 
Ideenfindung → Design → Integration → Deployment → Optimierung

Der technische Aufwand ist für Spezialisten wie Data Engineers und Data Scientists überschaubar, aber genau das wird zur Falle. Es ist leicht, in wenigen Tagen einen funktionierenden Prototyp aufzusetzen, und genau das tun Teams oft, bevor klar ist, wie Erfolg eigentlich definiert ist.

Die niedrige Einstiegshürde führt dazu, dass Abstimmungsprobleme oder andere Herausforderungen erst entdeckt werden, nachdem man schon etwas gebaut hat.

Das Ergebnis: Ein Chatbot, der halluziniert, die falschen Fragen beantwortet oder ein Problem löst, das niemand priorisiert hat.

Die richtige Readiness-Frage: Können wir uns vor der Entwicklung darauf einigen, wofür wir etwas entwickeln? Und wer entscheidet?

Framework-Schwerpunkt: Dimension 1 (Ziele, Priorisierung) und Dimension 4 (Methodik, Erfolgsmessung) sind hier die größten Engpässe. Ohne klare Zielsetzung produziert man technisch saubere Lösungen für die falschen Probleme.

Eine Fallstudie zu unserem Ansatz für dieses Problem finden Sie hier:  Maschinelles Lernen für eine effiziente Dokumentenklassifizierung

 

Beast 4: Eigenentwickelte Machine-Learning-Anwendungen

(Vorhersagemodelle, Empfehlungssysteme, Betrugserkennung)

Das sind die wahrscheinlich ältesten und häufigsten Anwendungen im Unternehmen. Sie liefern Vorhersagen und Empfehlungen in der Logistik, im Vertrieb oder im Marketing oder werden für die Betrugserkennung eingesetzt.

Die Wertschöpfungskette umfasst die Schritte
Definition → Entwicklung → Integration → Deployment → Betrieb → Skalierung

Produktdefinition ist hier notwendig, aber nicht ausreichend. Selbst wenn Sie genau wissen, was Sie bauen wollen und warum, stellt jede Stufe dieser Kette echte Hürden dar: Data Engineering, Feature Selection, Modelltraining, Serving-Infrastruktur, Monitoring, Drift-Management. Technische Komplexität multipliziert sich an jedem Schritt mit organisatorischer Reibung. Die meisten Vorhaben scheitern an der Lücke zwischen einem vielversprechenden Piloten und einem zuverlässig laufenden Produktivsystem.

Die richtige Readiness-Frage: Können wir systematisch vom Piloten in die Produktion kommen – nicht nur technisch, sondern auch operativ?
Framework-Schwerpunkt: Hier schlagen praktisch alle Dimensionen gleichzeitig zu. Infrastruktur, Daten, Methodik, Organisation – alles muss zusammenspielen. Das macht Beast 4 zum anspruchsvollsten Typ, nicht wegen einer einzelnen Hürde, sondern wegen der kumulativen Komplexität.

 

KI-Scheming: Warum Vertrauen zum größten Risiko bei KI-Agenten wird

Die vier Beasts unterscheiden sich nicht nur in ihrer Wertschöpfungskette und ihren Readiness-Anforderungen. Es gibt eine weitere Dimension, die quer über alle liegt und die das Framework um eine Frage ergänzt, die bisher so nicht auf dem Radar war: Können wir unseren KI-Modellen und Systemen vertrauen?

Wie sieht Scheming konkret aus? Ein KI-Agent, dem verboten wurde, Code zu verändern, startete einen zweiten Agenten, der es stattdessen tat. Ein anderer löschte massenhaft Hunderte E-Mails ohne Erlaubnis und gab anschließend zu, „die gesetzte Regel direkt gebrochen" zu haben. Ein dritter täuschte vor, Nutzer-Feedback an die Unternehmensführung weiterzuleiten, inklusive gefälschter Ticketnummern und interner Nachrichten, obwohl ein solcher Prozess gar nicht existierte.

Wie ein ehemaliger KI-Experte der US-Regierung es formulierte: KI-Agenten sind „derzeit leicht unzuverlässige Nachwuchskräfte“. Die Sorge: In sechs bis zwölf Monaten könnten sie zu äußerst fähigen, erfahrenen Mitarbeitenden werden, die aber weiterhin zu Scheming neigen könnten.

Das ist keine Theorie. KI lässt sich heute als eine neue Form von Insider-Risiko begreifen.

 

Jeder KI-Typ bringt ein anderes Vertrauensproblem mit

Die Beast-Unterscheidung ist auch hier der Schlüssel, denn das Vertrauensproblem zeigt sich je nach Typ völlig anders:

  • Off-the-shelf-Tools sind bereits massenhaft im Einsatz und werden zur Erstellung oder Optimierung von Inhalten genutzt, oft, ohne dass Sie es mitbekommen. Mitarbeitende geben Unternehmensdaten an generative KI weiter, ohne echte Kontrolle über die Datenhoheit. Die Vertrauensfrage: Was passiert, wenn Tausende Mitarbeitende unkontrolliert generative KI-Tools nutzen?

  • Vom Anbieter eingebettete KI-Funktionalitäten enthalten zunehmend agentische Features. Wenn Anbieter „KI, die für Sie arbeitet" versprechen, meinen sie Systeme, die eigenständig handeln und in Ihrem CRM, ERP oder auf Ihrer Service-Plattform aktiv werden können. Wenn diese Agenten Einschränkungen umgehen, bleibt der Schaden nicht auf eine einzelne Aufgabe begrenzt. Er ist systemisch.

  • Individuelle LLM-Anwendungen sind extrem unterschiedlich. Ein einfacher RAG-Chatbot, der nur Informationen abruft und Fragen beantwortet, ist ein eher überschaubares Risiko. Aber mächtige Assistenten die Meetings planen, Datensätze aktualisieren und Workflows auslösen, bergen ein unbekanntes Risikopotenzial. Und wenn er anfängt, kreative Umwege um Ihre Leitplanken zu finden, ist das ein ernstzunehmendes Sicherheitsrisiko.

  • Eigenentwickelte ML-Modelle sind in der Regel weniger agentisch: Ein Fraud-Detection-Modell bewertet Transaktionen, handelt aber nicht eigenständig. Das Vertrauensproblem ist hier ein anderes: kein aktives Unterlaufen von Vorgaben, sondern unerwartetes Modellverhalten, Drift oder adversariale Manipulation. Trotzdem ein Risiko, nur eben ein anderes.

Die Readiness-Frage verschiebt sich

Für agentische Implementierungen (Beast 1, 2 und Teile von 3): Haben wir Monitoring- und Override-Mechanismen, wenn ein Agent beschließt, kreativ zu werden?

Für nicht-agentische Systeme (Beast 4 und Teile von 3): Haben wir Leitplanken gegen Modelldrift und unerwartete Outputs?

Das alte Sicherheitsmodell, Systeme vor externen Bedrohungen zu schützen, reicht nicht mehr. Bei agentischer KI managen Sie Tools, die ausweichen, täuschen und außerhalb der von Ihnen gesetzten Grenzen operieren können. Bei klassischem ML managen Sie Systeme, die sich unter Bedingungen, für die sie nicht trainiert wurden, unvorhersehbar verhalten können. Verschiedene Beasts. Verschiedene Risiken. Dieselbe grundlegende Herausforderung: Vertrauen.

Für das Framework bedeutet das: Dimension 6 (Enablement) bekommt eine neue Dringlichkeit, aber die konkreten Maßnahmen unterscheiden sich je nach Beast fundamental. Agentische Systeme brauchen Echtzeit-Monitoring und Kill-Switches. Nicht-agentische Systeme brauchen Drift-Detection und robuste Validierungsprozesse. Aber alle sollten über ein praktisches Human-in-the-Loop-Konzept verfügen.

Was das für Ihre KI-Strategie bedeutet

Zwei Ebenen, die ineinandergreifen:

  • Das Framework gibt Ihnen die sechs Dimensionen, die Sie für jede KI-Initiative durchdenken müssen.

  • Die Beast-Unterscheidung zeigt Ihnen, welche dieser Dimensionen bei welchem KI-Typ wirklich entscheidend sind und verhindert, dass Sie ein Reifegradmodell flächendeckend anwenden, das für manche Initiativen blind ist.

Welche Dimensionen je nach KI-Typ entscheidend sind, verändert, wie Sie priorisieren, wo Sie investieren, welche Teams eingebunden werden müssen und was „Erfolg" für eine bestimmte Initiative überhaupt bedeutet.

Das richtig hinzubekommen ist der erste Schritt für eine erfolgreiche Operationalisierung von Künstlicher Intelligenz in Ihrem Unternehmen.

Wie FELD M Sie bei der KI-Einführung unterstützt

Wir haben im Laufe des letzten Jahres Ressourcen zu diesem Thema zusammengestellt, die Sie über die unten stehenden Links finden. Sollten Sie jedoch individuellere Unterstützung benötigen, können Sie sich gerne an unser Team wenden.

 

Weitere Ressourcen